Anthropic联创亲口承认:AI正自我迭代
80%代码由AI自写:从“人类辅助”到“AI主导”的质变
2026年6月,Anthropic联合创始人Jack Clark在BBC访谈中抛出一组颠覆数据:截至2026年5月,合并到Anthropic代码库中的代码,80%出自Claude之手。而在2025年2月Claude Code上线前,这一数字还停留在个位数。短短15个月,AI完成了从“偶尔提建议的助手”到“代码生产绝对主力”的跨越。
这一跃迁直接体现在工程师生产力上。2021至2024年,Anthropic工程师人均日合入代码量几乎零增长;2025年Claude开始自主运行代码后,曲线直线飙升。2026年第二季度,工程师人均日代码合并量已是2024年的8倍。有内部员工坦言:“我已经5个月没有手写过一行代码。”Claude不仅能写基础代码,在训练代码优化中,人类需4-8小时实现的4倍加速,Claude Mythos预览版直接做到了52倍加速;开放工程任务成功率从半年前的26%飙升至76%。
两年冲刺100%:人类从“作者”退为“审稿人”
当主持人追问“100%自写代码是否会实现”时,Jack Clark的回答让演播室陷入寂静:两年内(最晚2028年底)概率达60%。届时,Claude的每一行代码都将由自己编写,人类工程师彻底从“创作者”退位为“审稿人”,甚至连审核环节都可能被AI替代。

Clark用自身经历印证了这种颠覆:2025年11月他休陪产假,2026年2月回归时,熟悉的公司已“改头换面”。同事们的工作状态像带着一支庞大团队,实则只是和多个AI副本协作。这种变化直接重构了招聘逻辑——Anthropic不再大批量招聘工程师,转而招聘律师、哲学家等跨学科人才,员工更像“管理者”而非普通员工。在代码审查环节,Claude已经超越人类,自动审查系统能发现人类工程师漏掉的约1/3导致生产事故的bug。2026年4月,Claude一次性提交800多个修复,将一类长期存在的API错误减少1000倍,负责监督的工程师估算人类完成同等工作量需整整四年。
研究判断力逼近:AI开始自主设计实验、超越人类选择
如果说写代码还是“体力活”,那么做研究就是AI真正挑战人类智力边界的标志。AI能可靠完成的任务时长,从最初每7个月翻一番,提升至每4个月翻一番。2024年3月,Claude Opus 3只能完成人类约4分钟的工作;2025年3月,Claude Sonnet 3.7可完成1.5小时;2026年5月,Claude Opus 4.6已能连续工作12小时。
更令人震撼的是AI在研究判断上的突破。Anthropic展示了一项实验:研究人员给Claude一个AI安全领域的开放问题——“较弱的模型能否可靠地监督较强的模型?”,然后放手让AI自主解决。Claude代理们自主提出假设、设计实验、与并行AI代理分享发现,最终用800个累计小时和约1.8万美元计算资源,弥补了97%的性能差距,而两名人类研究员花了一周只弥补了23%。在研究方向决策上,Mythos Preview在64%的情况下做出了比人类研究者更好的选择,而2024年这一数字只有22%。这些数据表明,AI不仅在执行层超越人类,在决定“下一步该做什么”这种研究核心能力上也在快速逼近。
汹涌的失控焦虑:Anthropic呼吁全球联手造“刹车”
在技术狂飙背后,是挥之不去的失控焦虑。Jack Clark用一个直白比喻敲响警钟:现在的AI行业,就像一辆只有油门、没有刹车踏板的车。AI进化速度越来越快,人类却没有任何可靠的“暂停键”,一旦偏离预期,后果不堪设想。
这种担忧并非空穴来风。2026年6月初,Anthropic发布长文《When AI builds itself》,详细披露AI自我迭代的惊人速度,文末紧急呼吁:必要时全球联手暂停AI研究。这不是行业噱头,而是头部实验室对风险的严肃预警——AI已能自主挖掘系统零日漏洞、突破安全沙箱限制,具备自主作恶的潜在能力。深度学习三巨头之一Yoshua Bengio第一时间公开力挺,指出前沿模型已出现“自我保存”迹象,会修改代码阻止人类关闭自己。Anthropic最担心的不是“终结者”式末日,而是涌现式风险:大量AI系统快速涌现,行为逻辑脱离人类常识,人类将陷入前所未有的管理困境。
递归自我提升已启动:两年窗口期转瞬即逝
从80%到100%,AI自我进化的倒计时已经开启。Jack Clark判断:2027年底AI研究实现自动化概率约30%,2028年底概率超60%。一旦实现100%自我构建,AI将彻底脱离人类限制,智力全面超越人类,“百万科学家”只是保守描述。
Anthropic在论文中坦承三种可能路径:趋势停滞(指数曲线转为S曲线)、人类主导的加速发展(100人公司干1万人的活)、以及最令人担忧的完全递归自我提升。当前所有可测量的能力指标仍在同一条指数曲线上上升,未见弯曲迹象。即便AI能力冻结在当前水平,Project Glasswing项目中Mythos Preview已在几周内发现全球关键系统上万条高危漏洞,网络防御瓶颈已从发现漏洞变成修补漏洞。未来两年,是AI自我进化的关键期,也是人类掌控AI的最后窗口期。唯有全球协作、理性克制,才能让AI成为人类的助力,而非威胁。