AI看病成为医患新包袱?补上「多轮追问」,通用AI才迈得过医疗关

患者带着AI诊断书挤满诊室,医生沟通成本激增

越来越多患者习惯在就诊前先问AI。据界面新闻采访,门诊里不少人拿着同一套AI结论来求证,医生反馈“患者过度依赖大模型诊断,导致医患沟通成本增加”。一位“95后”家长因孩子反复咳嗽发热,用AI问诊后按“普通呼吸道感染”居家用药,结果孩子延误治疗,最终确诊肺炎。汕头大学医学院第一附属医院也披露类似案例:AI误判为普通感冒,实则腺病毒感染,孩子反复发烧近一个月。AI给出的“一次性”结论看似省事,却让医生必须从头厘清病情,反而更累。

AI把TSH认成HCG,单轮问答暴露“幻觉”风险

新京报贝壳财经实测7款健康大模型解读体检报告,发现AI并非万无一失。一款应用将评估甲状腺功能的核心指标TSH(促甲状腺激素)误读为HCG(人绒毛膜促腺激素),建议用户“优先排查是否怀孕”。出现同样错误的还有另一款应用。医疗垂类技术人员坦言,“幻觉是大模型的通病,垂类模型也只能尽量减少”。更关键的是,多数AI仅做单轮判断,缺乏追问能力——比如报告显示TSH偏高,只有百度文心健康追问了“是否有相关症状”。没有多轮追问,AI就无法像医生那样通过层层排除确诊,导致患者被误导。

医生“AI分身”日均咨询3.2万次,靠的是“层层追问”

在杭州第七人民医院,医生毛洪京的“AI分身”却能做到日均咨询3.2万人次。秘诀在于“多轮追问”:AI先问“是入睡困难还是容易醒”,再引导患者完成睡眠质量测评,最后自动生成报告推给医生。这套流程让医患有效沟通时长增加50%。广东第二人民医院的徐谷根“AI分身”也已进驻14个社区卫生服务中心,累计服务超2万人次。这些“分身”并非简单回答问题,而是通过角色分层(陪伴式、引导式、专业咨询式)和功能限定,在追问中逐步缩小范围,只为筛查评估,不做最终诊断。

技术攻关与政策护栏并行,填补“追问”短板

医疗大模型从实验室走向临床,必须补上“多轮追问”这个缺口。北京清华长庚医院结石领域大模型“石说AI”要求模型引用最新权威文献,并采取“自检+双医”模式。陈俊仁团队的daGOAT模型则通过真实病例反复验证,能自主追踪患者上百个动态指标,实现条件式自主诊疗。但专家指出,通用AI的“黑箱”和幻觉仍是难点,多模态数据融合(影像、病理、基因组)也让追问更难实现。

政策层面,国家卫健委等部门已发布84个AI医疗应用场景指引,明确“禁止用AI完全替代医务人员专业判断”。浙江建立“推荐—审核—评价”全流程管控,要求AI回答全程留痕、保存至少3年,且绝不允许给出诊断结论或用药建议。上海则要求医疗大模型必须通过伦理安全测评才能上线。这些规范倒逼AI研发必须强化“追问”能力,而非给出武断结论。

从“单轮应答”到“多轮追问”,通用AI的医疗关才刚起步

真正的AI医生不该是直接给答案的“百度百科”,而应像医生一样循环提问、验证假设。目前多数C端健康应用仍停留在单轮解读,但个别已经开始试水:蚂蚁阿福、小荷AI医生会在解读后追问症状;京东健康则提供配套医生问答。业内共识是,只有具备多轮追问、动态推理、风险识别能力的AI,才能从“信息工具”升级为“可信助手”。正如专家所言:“全知全能的AI医生对患者价值更大,但距离临床还较远。”当AI学会像医生一样“追问”,医患之间的包袱才能变成桥梁。