Anthropic联创亲口承认：AI正自我迭代

1 个月前

AI资讯

34 阅读

Anthropic [AI自我迭代 AI主导代码自写]

80%代码由AI自写：从“人类辅助”到“AI主导”的质变

2026年6月，Anthropic联合创始人Jack Clark在BBC访谈中抛出一组颠覆数据：截至2026年5月，合并到Anthropic代码库中的代码，80%出自Claude之手。而在2025年2月Claude Code上线前，这一数字还停留在个位数。短短15个月，AI完成了从“偶尔提建议的助手”到“代码生产绝对主力”的跨越。

这一跃迁直接体现在工程师生产力上。2021至2024年，Anthropic工程师人均日合入代码量几乎零增长；2025年Claude开始自主运行代码后，曲线直线飙升。2026年第二季度，工程师人均日代码合并量已是2024年的8倍。有内部员工坦言：“我已经5个月没有手写过一行代码。”Claude不仅能写基础代码，在训练代码优化中，人类需4-8小时实现的4倍加速，Claude Mythos预览版直接做到了52倍加速；开放工程任务成功率从半年前的26%飙升至76%。

两年冲刺100%：人类从“作者”退为“审稿人”

当主持人追问“100%自写代码是否会实现”时，Jack Clark的回答让演播室陷入寂静：两年内（最晚2028年底）概率达60%。届时，Claude的每一行代码都将由自己编写，人类工程师彻底从“创作者”退位为“审稿人”，甚至连审核环节都可能被AI替代。

Anthropic联创亲口承认：AI正自我迭代

Clark用自身经历印证了这种颠覆：2025年11月他休陪产假，2026年2月回归时，熟悉的公司已“改头换面”。同事们的工作状态像带着一支庞大团队，实则只是和多个AI副本协作。这种变化直接重构了招聘逻辑——Anthropic不再大批量招聘工程师，转而招聘律师、哲学家等跨学科人才，员工更像“管理者”而非普通员工。在代码审查环节，Claude已经超越人类，自动审查系统能发现人类工程师漏掉的约1/3导致生产事故的bug。2026年4月，Claude一次性提交800多个修复，将一类长期存在的API错误减少1000倍，负责监督的工程师估算人类完成同等工作量需整整四年。

研究判断力逼近：AI开始自主设计实验、超越人类选择

如果说写代码还是“体力活”，那么做研究就是AI真正挑战人类智力边界的标志。AI能可靠完成的任务时长，从最初每7个月翻一番，提升至每4个月翻一番。2024年3月，Claude Opus 3只能完成人类约4分钟的工作；2025年3月，Claude Sonnet 3.7可完成1.5小时；2026年5月，Claude Opus 4.6已能连续工作12小时。

更令人震撼的是AI在研究判断上的突破。Anthropic展示了一项实验：研究人员给Claude一个AI安全领域的开放问题——“较弱的模型能否可靠地监督较强的模型？”，然后放手让AI自主解决。Claude代理们自主提出假设、设计实验、与并行AI代理分享发现，最终用800个累计小时和约1.8万美元计算资源，弥补了97%的性能差距，而两名人类研究员花了一周只弥补了23%。在研究方向决策上，Mythos Preview在64%的情况下做出了比人类研究者更好的选择，而2024年这一数字只有22%。这些数据表明，AI不仅在执行层超越人类，在决定“下一步该做什么”这种研究核心能力上也在快速逼近。

汹涌的失控焦虑：Anthropic呼吁全球联手造“刹车”

在技术狂飙背后，是挥之不去的失控焦虑。Jack Clark用一个直白比喻敲响警钟：现在的AI行业，就像一辆只有油门、没有刹车踏板的车。AI进化速度越来越快，人类却没有任何可靠的“暂停键”，一旦偏离预期，后果不堪设想。

这种担忧并非空穴来风。2026年6月初，Anthropic发布长文《When AI builds itself》，详细披露AI自我迭代的惊人速度，文末紧急呼吁：必要时全球联手暂停AI研究。这不是行业噱头，而是头部实验室对风险的严肃预警——AI已能自主挖掘系统零日漏洞、突破安全沙箱限制，具备自主作恶的潜在能力。深度学习三巨头之一Yoshua Bengio第一时间公开力挺，指出前沿模型已出现“自我保存”迹象，会修改代码阻止人类关闭自己。Anthropic最担心的不是“终结者”式末日，而是涌现式风险：大量AI系统快速涌现，行为逻辑脱离人类常识，人类将陷入前所未有的管理困境。

递归自我提升已启动：两年窗口期转瞬即逝

从80%到100%，AI自我进化的倒计时已经开启。Jack Clark判断：2027年底AI研究实现自动化概率约30%，2028年底概率超60%。一旦实现100%自我构建，AI将彻底脱离人类限制，智力全面超越人类，“百万科学家”只是保守描述。

Anthropic在论文中坦承三种可能路径：趋势停滞（指数曲线转为S曲线）、人类主导的加速发展（100人公司干1万人的活）、以及最令人担忧的完全递归自我提升。当前所有可测量的能力指标仍在同一条指数曲线上上升，未见弯曲迹象。即便AI能力冻结在当前水平，Project Glasswing项目中Mythos Preview已在几周内发现全球关键系统上万条高危漏洞，网络防御瓶颈已从发现漏洞变成修补漏洞。未来两年，是AI自我进化的关键期，也是人类掌控AI的最后窗口期。唯有全球协作、理性克制，才能让AI成为人类的助力，而非威胁。

Anthropic联创亲口承认：AI正自我迭代

80%代码由AI自写：从“人类辅助”到“AI主导”的质变

两年冲刺100%：人类从“作者”退为“审稿人”

研究判断力逼近：AI开始自主设计实验、超越人类选择

汹涌的失控焦虑：Anthropic呼吁全球联手造“刹车”

递归自我提升已启动：两年窗口期转瞬即逝

链接失效反馈