最近我国的科技企业传出了个好消息,北京百川智能科技有限公司发布了他们自主研发的新一代医疗领域大模型Baichuan-M3。这个模型在全球公认的权威评测HealthBench中得了65.1分,位列第一。这可是咱们自己的AI医疗模型第一次在这个国际权威基准上把美国OpenAI公司最新的GPT-5.2模型给超越了。 百川智能的CEO王小川提到,目前语言的理解和生成能力依然是AI的核心。他还强调医疗AI不能只局限于院内辅助诊断,还得关注院外健康管理、疾病预防和患者教育这些更广阔的领域。这次Baichuan-M3不仅得分高,技术上也有很多突破。比如在复杂临床决策能力的评测Hard子项中,Baichuan-M3拿了44.4分,也是第一名。 这个模型不仅评分领先,还有很多针对医疗场景的创新。它在训练阶段就把事实一致性的约束前移了,通过强化学习框架把“知之为知之,不知为不知”的原则内化为模型的基础能力。这样一来,在纯模型设置下,Baichuan-M3把医疗幻觉率控制在3.5%的水平,全球最低。这就为AI在严肃医疗场景下的安全应用打下了基础。 另外一个亮点是Baichuan-M3具备了端到端的严肃问诊交互能力。它能像资深医生一样模拟思维路径,主动追问关键病史和风险信号。这样就能把患者模糊的主诉转化为结构化信息供深度推理。评测显示这项能力已经超过了真人医生的平均水平。 百川智能把这个模型开源出来了。他们希望能聚集全球开发者的智慧共同推动医疗AI技术的发展。从全球视角看,AI医疗现在正成为各大科技巨头争夺的赛道。最近OpenAI发布了ChatGPT Health、Anthropic推出了Claude for Healthcare,竞争越来越激烈。咱们的企业在关键时刻取得性能领先并且坚持开源路线,不仅展现了技术实力还有助于推动普惠应用。 这是我国在人工智能前沿领域积极进取的一个缩影。Baichuan-M3的突破体现了咱们从技术追赶到局部领先的转变,也展示了把技术发展服务于人民健康和坚守安全伦理底线的态度。未来如何把技术优势转化为可及、可负担、可信赖的服务能力还需要各方共同努力去探索实践。