前DeepMind华人研究员离职喊话:AI行业所有人都搞错了方向

从DeepMind离职后,他发了一篇4000词“檄文”

2026年5月17日,一位名叫Lun Wang的年轻研究员从谷歌DeepMind离职,随即在个人博客上挂出了一篇长达4000词的文章。他在文中直言:“所有人都搞错了方向。”这篇长文迅速在AI圈引发震动,短短数小时内被大量转发,不少从业者开始重新审视当前行业的发展路径。

现有基准测试:一个被忽视的致命错误

Lun Wang指出,目前AI行业广泛使用的基准测试存在根本性缺陷——这些测试都隐含一个假设:下一代模型只是当前模型的简单升级版。他举例说,许多排行榜上的得分提升,实际上反映的是模型对测试集的“过拟合”,而非真正的智能进步。当模型能力跨越某个临界点后,旧有基准几乎完全失效,无法揭示模型在新场景下的真实表现。行业如果继续依赖这些“古董级”测试,就会在错误的指标上不断内卷。

前DeepMind华人研究员离职喊话:AI行业所有人都搞错了方向

安全评估的虚假安全感:假设下一代只是当前模型的延续

更让Lun Wang感到担忧的是安全评估领域的现状。他认为,当前绝大多数安全测试同样建立在“下一代模型与当前模型行为模式相似”的假定之上。实际上,随着模型规模和能力跃升,可能突然出现全新的风险类别(例如工具滥用、长期规划中的欺骗行为)。现有的评估手段就像用驾照考试去检验F1赛车手——完全错位。这种“线性外推”的思维,让行业产生了虚假的安全感。

“所有人都搞错了方向”——真正的瓶颈在哪里?

在文章中,Lun Wang明确指出了被低估的瓶颈:模型的可控性与对齐研究远远落后于能力提升的速度。他认为,行业过度追求参数规模和推理速度,却忽略了如何让模型真正理解人类的深层意图,以及如何在复杂未知情境下保持鲁棒可靠。他警告,如果继续沿着“堆数据、堆算力、刷榜”的老路走,而不转向对齐和评估方法论的根本革新,AI系统可能会在人们最意想不到的地方“翻车”。

行业该如何转向?这位研究员的建议

Lun Wang给出了三个具体方向:

  • 重构基准测试:设计能够动态适应模型能力进化、并能探测“能力突现”的测试体系。
  • 引入“反事实安全评估”:针对模型可能出现的跳跃性行为,预设对抗性场景和反事实假设。
  • 设立独立的、跨学科的对齐研究机构:打破业界“练模型-发论文-融资”的闭环,将安全研究从附属地位提升为核心优先级。

他的离职喊话,本质上是一声警钟:当所有人都在埋头加速时,或许该停下来看看罗盘是否指向了正确的方向。