AI巨头发出警告：AI系统正迅速进步，它们可能很快能够自我改进

1 个月前

AI资讯

17 阅读

AI 警告自我改进递归

Anthropic发出紧急警告：AI正逼近自我改进临界点

美国AI巨头Anthropic于2026年6月4日发布重磅文章，直言AI系统正以惊人速度进化，即将跨入一个危险的门槛——递归自我改进。这意味着AI能够在几乎无需人类干预的情况下自行提升性能，从而引发不可控的连锁反应。Anthropic研究院负责人马里纳·法瓦罗和联合创始人杰克·克拉克在文中强调，全球社会必须正视这一潜在风险，并考虑放缓或临时暂停前沿AI开发，以便让社会治理和安全研究跟上技术的脚步。

递归自我改进：一场“自己造自己”的赛跑

Anthropic内部数据揭示了一个令人不安的趋势：AI正在加速AI的发展，通往递归自我改进的路径已经浮现。所谓“递归自我改进”，是指AI系统能够自主优化自身代码、发现漏洞并增强能力，形成一种指数级的进化循环。这一机制被视为人工智能跨越人类智慧门槛、引发“智能爆炸”的核心关键。Anthropic认为，当前模型的能力进步已逼近这一临界点，一旦突破，人类可能失去对AI进化的控制权。

AI巨头发出警告：AI系统正迅速进步，它们可能很快能够自我改进

全球暂停开发倡议：核武式核查机制能否奏效？

面对这一威胁，Anthropic呼吁全球顶级AI实验室共同商讨放缓策略，并提出建立一套可核查的全球协议，类似于核武器条约。文章指出，暂停或放缓只有在被广泛遵守时才有效，因此需要一个能够监督各国和各大科技公司是否遵守承诺的机制。不过，Anthropic也坦承，相比于核武核查，AI领域的作弊检测将更为棘手。公司计划在未来几个月与政策制定者、研究人员及其他AI公司展开对话，共同研究如何实现这一核查系统，并强调“窗口已经到来，AI公司之外的人士也应参与审议”。

Claude Mythos的惊人能力：是安全守护还是营销噱头？

Anthropic对自身前沿模型Claude Mythos的发布策略，恰恰印证了警告的紧迫性。该模型在预览版测试中展现了超强的自主网络安全能力——能够自行发现并串联多个“零日漏洞”，甚至挖掘出隐藏数十年的系统缺陷。然而，Anthropic并未全面开放，而是通过“Project Glasswing”计划，仅向微软、苹果、亚马逊等约150家大型科技机构和资安组织提供，用于防御性修复。这种“安全优先”的封闭发布，既体现了对模型危险性的担忧，也招致了批评：部分业内人士认为，这本质上是借“安全警告”来营销自身技术实力，并借监管限制竞争对手。

业界分歧与未来博弈：AGI真的来了吗？

对于Anthropic的警告，业内看法不一。前Meta首席AI科学家杨·勒丘恩直言，现有大模型远未达到人类智能水平，其能力更接近“猫的脑力”，递归自我改进仍是遥远神话。而Anthropic首席执行官达里奥·阿莫代伊则多次预警，AI可能加剧不平等，并取代大量初级白领工作。宾夕法尼亚大学教授Ethan Mollick则给出了折中评价：文章中既有真诚的自我反思，也有营销成分，但更重要的是，Anthropic对未来AI发展方向的判断值得关注。这场关于AI是否即将“自我造自我”的争论，正随着技术进步而愈演愈烈。

AI巨头发出警告：AI系统正迅速进步，它们可能很快能够自我改进

Anthropic发出紧急警告：AI正逼近自我改进临界点

递归自我改进：一场“自己造自己”的赛跑

全球暂停开发倡议：核武式核查机制能否奏效？

Claude Mythos的惊人能力：是安全守护还是营销噱头？

业界分歧与未来博弈：AGI真的来了吗？

链接失效反馈