Anthropic 示警：AI 执行力逼近甚至超过人类，方向把控等方面人类仍具优势

1 个月前

AI资讯

59 阅读

Anthropic 代码编写人类优势 AI执行力

AI自我造血：从“打下手”到包揽80%代码

一年前，Anthropic的工程师还在亲手调试每一行训练代码；如今，他们5个月没自己写过任何代码。这家公司的最新报告《When AI builds itself》披露，Claude已承担起80%以上的代码编写工作。工程师只丢给模型一段文字描述和集群权限，Claude就能在运行中的任务里逐一排查环境变量，揪出隐蔽的调试标志并完成复现、验证和修复。同样一项训练代码优化，人类需要4到8小时实现4倍加速，而Claude Mythos Preview直接干到了52倍。工程师人均产出随之暴增8倍——AI不再是工具，而是真正的“代码合伙人”，甚至在编写自己继任者的训练代码。

速度碾压：实验优化已甩开人类一个数量级

Anthropic设计了一个极为刁钻的实验：翻出真实研究session里人类研究员“走弯路”的129个时刻，把弯路之前的全部上下文喂给Claude，问它“下一步该怎么走”。结果2025年11月的Opus 4.5版本，有51%的概率给出比人类更优的下一步；而到了2026年的某个版本（参考中未明确名称但提及“Mythos Preview”），这一比例跃升至64%。在“端到端”开放实验中，Claude智能体被丢进AI安全难题后，自己提出假设、设计实验、与并行智能体交换发现。写代码、跑实验、判断下一步——人类正被逐个环节拉开距离。Anthropic直言，在目标明确的实验优化环节，“人类已经被甩出了一个数量级”。这正是阿姆达尔定律的体现：当AI可自动化的部分比例越来越高，整个研发流程的加速将不再线性，而是指数级。

最后的壁垒：人类在研究品味与方向把控上仍不可替代

尽管“汗水”正在全面自动化——工程迭代、实验跑分、代码编写均被AI包揽——Anthropic强调，人类仍有两大核心优势尚未被攻克。其一是研究品味：在无数待探索方向中判断“哪个问题值得死磕”，这需要深厚的领域直觉和跨领域联想能力，而当前所有模型的“研究品味”本质上仍是对人类已有偏好的模仿。其二是方向把控：当AI降速或输出荒谬结果时，人类需要从战略层面叫停并重新规划路径。参考中明确指出，AI模型今天那些罕见的失准行为，可能会在一代代自我构建中复合放大，直到失控，而“只有人类才能识别并修复这类方向性错误”。Anthropic甚至直言，也许“研究品味就是堆算力堆不出来的东西”——这成为递归自我改进的最后一道人为壁垒。

飞轮加速已响：Anthropic呼吁全球暂停以争取对齐时间

“当AI改进AI的速度超过人类改进AI的速度，飞轮就会脱离人类的手开始自转，且越转越快。”Anthropic将这种递归自我改进称为通往超级智能（ASI）路径上的“最后关卡”。目前，80%的代码、8倍的产能、52倍的加速、64%的判断胜率——每一个数字都是飞轮加速的一声咔哒。一旦人类彻底退居验证和监督角色，AI将只受算力制约，从AGI到ASI的距离可能短到以“模型代际”计量。正因如此，Anthropic建议全球暂停开发最强大的AI系统，建立多国、多实验室的协调机制（类似核武军控协议），以便让社会结构和对齐研究追上技术脚步。该报告将放缓研发比作“为安全系统争取补齐漏洞的时间”，并警告说，如果单方面暂停无异于军备竞赛中的自我解除武装，必须美中两国及各大科技厂同步实施，且彼此可验证。

Anthropic 示警：AI 执行力逼近甚至超过人类，方向把控等方面人类仍具优势

AI自我造血：从“打下手”到包揽80%代码

速度碾压：实验优化已甩开人类一个数量级

最后的壁垒：人类在研究品味与方向把控上仍不可替代

飞轮加速已响：Anthropic呼吁全球暂停以争取对齐时间

链接失效反馈