百川发布新一代医疗增强大模型 M4:登顶 OpenAI 医疗评测,超越 GPT-5.5

登顶全球医疗评测:全面超越GPT-5.5

百川智能在“AI医疗新范式”学术论坛上正式发布Baichuan-M4,该模型在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗榜单中同时位列世界第一,全面超越GPT-5.5、Opus 4.7、DeepSeek-V4-Pro等主流模型。相比于此前发布的Baichuan-M2(在医疗复杂问题上比肩GPT-5)和开源模型Baichuan-M3(超越人类医生),M4在技术指标上再次实现飞跃,尤其在硬核医疗评测中展现了绝对统治力。百川智能已与北京儿童医院、中国医学科学院肿瘤医院、瑞金医院等三家国家顶尖医院展开临床联合研究,推动模型从实验室走向真实诊疗一线。

低幻觉与强循证:医疗专用模型的三大刚需突破

针对通用大模型在医疗场景中“幻觉严重、循证推理能力差、不善于提问”三大短板,Baichuan-M4通过底层技术创新实现根本性突破:

  • 低幻觉保障:依托百川原创的“事实性感知强化学习算法”,裸模型的事实性幻觉率降至3.3%,再创全球新低,极大提升了医疗问诊的安全性与可信度。
  • 强循证路径:将权威医学指南拆解为1000余条原子化临床路径,每条由顶尖临床专家定义与校验,确保诊断遵循严格的循证医学路径。
  • 深度问诊能力:能像临床医生一样步步追问,拥有超长记忆能力,而非根据患者第一句话就盲目下结论。王小川强调:“医疗容不得编造,一个错误判断可能危及生命。”

百川发布新一代医疗增强大模型 M4:登顶 OpenAI 医疗评测,超越 GPT-5.5

AI家庭医生百小医:从问答机器人到全科管家

百川智能同步推出AI家庭医生产品“百小医”,王小川将其定义为“身体”,负责触达用户。产品通过企业微信(百小医@百川家医)运行,用户可将其拉入家庭群作为“家庭新成员”:

  • 自动建档:为每位家庭成员建立独立健康档案,在自然对话中结构化捕捉身体状态、用药历史和检查数据。
  • 主动干预:能从日常闲聊中识别高危健康信号,主动提醒复诊和用药,区别于被动问答的“咨询机器人”。
  • 全周期管理:覆盖就医前整理、诊后随访、长期健康档案管理,实现从单次咨询到“全科管家”的升级。

四级诊疗新范式:构建家庭医疗底座

沿着“双医协同”逻辑,百川智能提出四级诊疗新范式:在现有三级医院、二级医院、基层医院体系之上,通过AI家庭医生构建“家庭底座”:

  • 向上衔接:AI家庭医生在最前端完成疾病的初步筛查和主动分诊,缓解优质医疗资源不足的压力。
  • 向下触达:三级医院的随访与疾病管理能力沿同一路径下沉,直接触达每一个家庭。
  • 生态开放:百川宣布将M4与百小医的能力底座开放给药企、保险、智能硬件、医疗机构共建生态,推动AI医疗从“实验室精准判读”走向“千家万户的日常守护”。

王小川的医疗AI思考:从咨询到精细化运营

王小川在论坛上坦言,过去一年通用大模型在医疗咨询规模虽达数千万人次,但一线临床反馈并不理想——“看似对、实际危险”,幻觉被包装成确定性,反而加剧医患矛盾。他强调,AI真正进入医疗必须依靠医疗增强大模型,而非简单替换医生。百川智能希望通过“医疗大模型+Agent”策略,将极致的技术参数优化与高频社交生态接入结合,跑通AI医疗长久以来难以实现的闭环。针对市场关注的IPO,王小川此前透露公司预计2027年启动上市,认为AI医疗虽成熟较晚,但方向明确,将成为大模型竞争的核心范式。