百川发布新一代医疗增强大模型 M4：登顶 OpenAI 医疗评测，超越 GPT-5.5

1 天前

AI资讯

7 阅读

AI医疗百川智能医疗大模型 Baichuan-M4

登顶全球医疗评测：全面超越GPT-5.5

百川智能在“AI医疗新范式”学术论坛上正式发布Baichuan-M4，该模型在HealthBench、HealthBench Hard、HealthBench Professional三大权威医疗榜单中同时位列世界第一，全面超越GPT-5.5、Opus 4.7、DeepSeek-V4-Pro等主流模型。相比于此前发布的Baichuan-M2（在医疗复杂问题上比肩GPT-5）和开源模型Baichuan-M3（超越人类医生），M4在技术指标上再次实现飞跃，尤其在硬核医疗评测中展现了绝对统治力。百川智能已与北京儿童医院、中国医学科学院肿瘤医院、瑞金医院等三家国家顶尖医院展开临床联合研究，推动模型从实验室走向真实诊疗一线。

低幻觉与强循证：医疗专用模型的三大刚需突破

针对通用大模型在医疗场景中“幻觉严重、循证推理能力差、不善于提问”三大短板，Baichuan-M4通过底层技术创新实现根本性突破：

低幻觉保障：依托百川原创的“事实性感知强化学习算法”，裸模型的事实性幻觉率降至3.3%，再创全球新低，极大提升了医疗问诊的安全性与可信度。
强循证路径：将权威医学指南拆解为1000余条原子化临床路径，每条由顶尖临床专家定义与校验，确保诊断遵循严格的循证医学路径。
深度问诊能力：能像临床医生一样步步追问，拥有超长记忆能力，而非根据患者第一句话就盲目下结论。王小川强调：“医疗容不得编造，一个错误判断可能危及生命。”

百川发布新一代医疗增强大模型 M4：登顶 OpenAI 医疗评测，超越 GPT-5.5

AI家庭医生百小医：从问答机器人到全科管家

百川智能同步推出AI家庭医生产品“百小医”，王小川将其定义为“身体”，负责触达用户。产品通过企业微信（百小医@百川家医）运行，用户可将其拉入家庭群作为“家庭新成员”：

自动建档：为每位家庭成员建立独立健康档案，在自然对话中结构化捕捉身体状态、用药历史和检查数据。
主动干预：能从日常闲聊中识别高危健康信号，主动提醒复诊和用药，区别于被动问答的“咨询机器人”。
全周期管理：覆盖就医前整理、诊后随访、长期健康档案管理，实现从单次咨询到“全科管家”的升级。

四级诊疗新范式：构建家庭医疗底座

沿着“双医协同”逻辑，百川智能提出四级诊疗新范式：在现有三级医院、二级医院、基层医院体系之上，通过AI家庭医生构建“家庭底座”：

向上衔接：AI家庭医生在最前端完成疾病的初步筛查和主动分诊，缓解优质医疗资源不足的压力。
向下触达：三级医院的随访与疾病管理能力沿同一路径下沉，直接触达每一个家庭。
生态开放：百川宣布将M4与百小医的能力底座开放给药企、保险、智能硬件、医疗机构共建生态，推动AI医疗从“实验室精准判读”走向“千家万户的日常守护”。

王小川的医疗AI思考：从咨询到精细化运营

王小川在论坛上坦言，过去一年通用大模型在医疗咨询规模虽达数千万人次，但一线临床反馈并不理想——“看似对、实际危险”，幻觉被包装成确定性，反而加剧医患矛盾。他强调，AI真正进入医疗必须依靠医疗增强大模型，而非简单替换医生。百川智能希望通过“医疗大模型+Agent”策略，将极致的技术参数优化与高频社交生态接入结合，跑通AI医疗长久以来难以实现的闭环。针对市场关注的IPO，王小川此前透露公司预计2027年启动上市，认为AI医疗虽成熟较晚，但方向明确，将成为大模型竞争的核心范式。

百川发布新一代医疗增强大模型 M4：登顶 OpenAI 医疗评测，超越 GPT-5.5

登顶全球医疗评测：全面超越GPT-5.5

低幻觉与强循证：医疗专用模型的三大刚需突破

AI家庭医生百小医：从问答机器人到全科管家

四级诊疗新范式：构建家庭医疗底座

王小川的医疗AI思考：从咨询到精细化运营

链接失效反馈