研究显示医学论文中的虚假参考文献数量激增,AI 难辞其咎

审计250万篇论文:伪造文献“现形”

由哥伦比亚大学人工智能研究员马克西姆·托帕兹(Maxim Topaz)等人领导的团队,对250万篇生物医学学术文献进行了大规模审计。结果发现,近3000篇论文中明确包含通过AI生成的伪造参考文献。这些参考文献看似结构完整,但实际不存在于任何正规数据库中,成为学术造假的新“地雷”。研究团队通过对比引用元数据和人工核查,确认了这些虚假引用并非传统抄袭或笔误,而是AI模型胡编乱造的结果。

12倍激增:AI造假“加速跑”

审计数据揭示了一个惊人的增长趋势:相比2023年,2025年发表的含有伪造引文的生物医学论文数量暴增了12倍。这意味着在短短两年内,AI生成的虚假引用已从零星个案演变为系统性学术不端。研究合著者指出,这一激增与生成式AI(如ChatGPT等)在论文写作中的广泛滥用高度吻合——科研人员利用AI快速生成参考文献列表,却未验证其真实性,导致大量“幽灵文献”混入同行评审系统。

明星学者中招:香港教授被撤职

虚假引用的影响已波及顶尖高校。香港大学叶兆辉教授因论文引用AI虚构文献而遭期刊撤稿,其本人随后卸任副院长职务。该论文涉及香港生育率研究,被证实大量参考了AI生成的虚假期刊名称、作者和DOI编号,且作者在论文中未声明使用AI工具。期刊撤稿声明明确指出:“这些不存在的参考文献是由于使用生成式AI将引用文章的PubMed ID转换为结构化条目所致。”这一事件凸显了AI造假对学术声誉的腐蚀力,即使是资深学者也难以幸免。

学术诚信警报:AI如何“炮制”虚假引用

AI生成虚假引用的机制并不复杂:当用户要求AI提供参考文献时,模型常基于训练数据中的模式“捏造”出看似合理的条目,包括伪造的论文标题、作者、期刊名和出版年份。由于这些引用在形式上与真实文献高度相似,传统审稿流程极难发现。研究警告,如果这一趋势不遏制,未来医学领域的系统性综述和Meta分析可能被污染,甚至引发临床决策依据的“沉默错误”——因为被引用的“文献”根本不存在,后续研究的结论将建立在空中楼阁之上。