前DeepMind华人研究员离职喊话：AI行业所有人都搞错了方向

1 个月前

AI资讯

86 阅读

AI行业 DeepMind 基准测试方向错误

从DeepMind离职后，他发了一篇4000词“檄文”

2026年5月17日，一位名叫Lun Wang的年轻研究员从谷歌DeepMind离职，随即在个人博客上挂出了一篇长达4000词的文章。他在文中直言：“所有人都搞错了方向。”这篇长文迅速在AI圈引发震动，短短数小时内被大量转发，不少从业者开始重新审视当前行业的发展路径。

现有基准测试：一个被忽视的致命错误

Lun Wang指出，目前AI行业广泛使用的基准测试存在根本性缺陷——这些测试都隐含一个假设：下一代模型只是当前模型的简单升级版。他举例说，许多排行榜上的得分提升，实际上反映的是模型对测试集的“过拟合”，而非真正的智能进步。当模型能力跨越某个临界点后，旧有基准几乎完全失效，无法揭示模型在新场景下的真实表现。行业如果继续依赖这些“古董级”测试，就会在错误的指标上不断内卷。

前DeepMind华人研究员离职喊话：AI行业所有人都搞错了方向

安全评估的虚假安全感：假设下一代只是当前模型的延续

更让Lun Wang感到担忧的是安全评估领域的现状。他认为，当前绝大多数安全测试同样建立在“下一代模型与当前模型行为模式相似”的假定之上。实际上，随着模型规模和能力跃升，可能突然出现全新的风险类别（例如工具滥用、长期规划中的欺骗行为）。现有的评估手段就像用驾照考试去检验F1赛车手——完全错位。这种“线性外推”的思维，让行业产生了虚假的安全感。

“所有人都搞错了方向”——真正的瓶颈在哪里？

在文章中，Lun Wang明确指出了被低估的瓶颈：模型的可控性与对齐研究远远落后于能力提升的速度。他认为，行业过度追求参数规模和推理速度，却忽略了如何让模型真正理解人类的深层意图，以及如何在复杂未知情境下保持鲁棒可靠。他警告，如果继续沿着“堆数据、堆算力、刷榜”的老路走，而不转向对齐和评估方法论的根本革新，AI系统可能会在人们最意想不到的地方“翻车”。

行业该如何转向？这位研究员的建议

Lun Wang给出了三个具体方向：

重构基准测试：设计能够动态适应模型能力进化、并能探测“能力突现”的测试体系。
引入“反事实安全评估”：针对模型可能出现的跳跃性行为，预设对抗性场景和反事实假设。
设立独立的、跨学科的对齐研究机构：打破业界“练模型-发论文-融资”的闭环，将安全研究从附属地位提升为核心优先级。

他的离职喊话，本质上是一声警钟：当所有人都在埋头加速时，或许该停下来看看罗盘是否指向了正确的方向。

前DeepMind华人研究员离职喊话：AI行业所有人都搞错了方向

从DeepMind离职后，他发了一篇4000词“檄文”

现有基准测试：一个被忽视的致命错误

安全评估的虚假安全感：假设下一代只是当前模型的延续

“所有人都搞错了方向”——真正的瓶颈在哪里？

行业该如何转向？这位研究员的建议

链接失效反馈