Anthropic 示警:AI 执行力逼近甚至超过人类,方向把控等方面人类仍具优势
AI自我造血:从“打下手”到包揽80%代码
一年前,Anthropic的工程师还在亲手调试每一行训练代码;如今,他们5个月没自己写过任何代码。这家公司的最新报告《When AI builds itself》披露,Claude已承担起80%以上的代码编写工作。工程师只丢给模型一段文字描述和集群权限,Claude就能在运行中的任务里逐一排查环境变量,揪出隐蔽的调试标志并完成复现、验证和修复。同样一项训练代码优化,人类需要4到8小时实现4倍加速,而Claude Mythos Preview直接干到了52倍。工程师人均产出随之暴增8倍——AI不再是工具,而是真正的“代码合伙人”,甚至在编写自己继任者的训练代码。
速度碾压:实验优化已甩开人类一个数量级
Anthropic设计了一个极为刁钻的实验:翻出真实研究session里人类研究员“走弯路”的129个时刻,把弯路之前的全部上下文喂给Claude,问它“下一步该怎么走”。结果2025年11月的Opus 4.5版本,有51%的概率给出比人类更优的下一步;而到了2026年的某个版本(参考中未明确名称但提及“Mythos Preview”),这一比例跃升至64%。在“端到端”开放实验中,Claude智能体被丢进AI安全难题后,自己提出假设、设计实验、与并行智能体交换发现。写代码、跑实验、判断下一步——人类正被逐个环节拉开距离。Anthropic直言,在目标明确的实验优化环节,“人类已经被甩出了一个数量级”。这正是阿姆达尔定律的体现:当AI可自动化的部分比例越来越高,整个研发流程的加速将不再线性,而是指数级。
最后的壁垒:人类在研究品味与方向把控上仍不可替代
尽管“汗水”正在全面自动化——工程迭代、实验跑分、代码编写均被AI包揽——Anthropic强调,人类仍有两大核心优势尚未被攻克。其一是研究品味:在无数待探索方向中判断“哪个问题值得死磕”,这需要深厚的领域直觉和跨领域联想能力,而当前所有模型的“研究品味”本质上仍是对人类已有偏好的模仿。其二是方向把控:当AI降速或输出荒谬结果时,人类需要从战略层面叫停并重新规划路径。参考中明确指出,AI模型今天那些罕见的失准行为,可能会在一代代自我构建中复合放大,直到失控,而“只有人类才能识别并修复这类方向性错误”。Anthropic甚至直言,也许“研究品味就是堆算力堆不出来的东西”——这成为递归自我改进的最后一道人为壁垒。
飞轮加速已响:Anthropic呼吁全球暂停以争取对齐时间
“当AI改进AI的速度超过人类改进AI的速度,飞轮就会脱离人类的手开始自转,且越转越快。”Anthropic将这种递归自我改进称为通往超级智能(ASI)路径上的“最后关卡”。目前,80%的代码、8倍的产能、52倍的加速、64%的判断胜率——每一个数字都是飞轮加速的一声咔哒。一旦人类彻底退居验证和监督角色,AI将只受算力制约,从AGI到ASI的距离可能短到以“模型代际”计量。正因如此,Anthropic建议全球暂停开发最强大的AI系统,建立多国、多实验室的协调机制(类似核武军控协议),以便让社会结构和对齐研究追上技术脚步。该报告将放缓研发比作“为安全系统争取补齐漏洞的时间”,并警告说,如果单方面暂停无异于军备竞赛中的自我解除武装,必须美中两国及各大科技厂同步实施,且彼此可验证。