我国医疗AI技术取得重大突破 百川智能发布新一代循证医疗模型

当前,医疗大模型临床辅助决策、病历质控、指南检索和医学教育诸上显示出应用潜力,但“看似合理却缺乏证据支撑”的内容偏差,仍是其进入高风险医疗场景的主要障碍。医学知识更新快、证据层级复杂,若模型无法清晰说明信息来源和证据强度——真实应用中就可能造成误导——进而影响医生对工具的信任和机构的落地意愿。 ,百川智能发布新一代医疗大模型Baichuan-M3 Plus,并提出以循证与可溯源能力为核心的技术路径:一是将多来源循证方法引入训练与推理环节,强调每条建议应有明确的医学证据支持;二是推出“证据锚定”机制,尝试将模型生成的医学结论与原始论文中的对应证据段落更精准地对齐,并提供引文线索;三是引入引用奖励模型,对错误引用进行惩罚,推动模型“确有证据支撑”的范围内推理与生成。企业披露称,该模型在事实性偏差控制上取得进展,并公布了幻觉率、匹配准确率等量化指标,显示其正推动医疗大模型从“能回答”走向“可核验”。 从成因看,医疗领域的内容风险不仅源于模型生成的固有特性,也与医学信息的结构化程度、证据层级差异以及诊疗情境的高度个体化对应的。过去部分模型更擅长给出总结性表述,却难以稳定地将结论与高质量证据对应;一旦出现引用不当、概念混用或将相关性误判为因果,后果临床场景中可能被放大。因此,围绕“降低偏差、明确来源、便于核验”的能力建设,已成为医疗大模型走向应用端的关键门槛。 就影响而言,若循证与可溯源能力能在更多评测与真实使用中持续验证,可能带来三上的积极变化。其一,提升临床辅助决策的可用性。医生诊疗节奏紧张的场景中需要的是可快速核验的依据链条,而非来源难以追溯的“结论式建议”。其二,推动医学教育与科研辅助更规范地使用。可溯源引用有助于把工具使用过程转化为学习过程,减少“只记答案”的倾向。其三,促进行业形成更贴近医疗安全要求的评价体系,将评估重点从泛化语言能力转向证据质量、引用可靠性与场景适配度等关键指标。 与技术发布同步,百川智能提出“海纳百川”计划,面向服务医务工作者的机构免费开放M3 Plus的API,适用场景包括临床辅助决策与医学教育。业内普遍认为,开放接口有助于降低机构试用与二次开发成本,加快模型进入医院信息系统、教学平台与科研工具链的速度。同时,这也对数据安全、合规审查和使用责任划分提出更高要求。医疗信息高度敏感,机构在接入此类能力时,需要在数据最小化、脱敏处理、访问审计、模型输出提示以及医生最终决策机制等上配套完善流程,避免将工具输出等同于医疗结论,防止“自动化偏差”在实际工作中形成依赖。 面向未来,医疗大模型的竞争将从参数规模、对话体验逐步转向以安全与证据为核心的综合能力:包括对指南与文献更新的及时吸收、对证据等级与适用人群的准确表达、对不确定性的明确提示、对不同科室与场景的定制化评测,以及在临床流程中的可控部署。随着更多机构参与试点并形成反馈闭环,医疗大模型有望在“可核验、可追责、可监管”的框架下成为医生的辅助工具而非替代者;同时,相关标准、第三方评测与监管规范也将成为影响行业走向的重要变量。

医疗关乎生命,精准关乎责任。百川智能M3 Plus模型的推出——不仅带来关键指标上的提升——更重要的是强化了以科学证据为基础的模型能力路径。通过免费开放API,让更多医疗机构和从业者能够低成本试用与验证,也为技术医疗场景的规范应用提供了入口。随着医疗大模型在可靠性与可解释性上持续完善,人工智能与医学的结合有望在提升诊疗效率、优化医疗资源配置等起到更实际作用。