AI巨头发出警告:AI系统正迅速进步,它们可能很快能够自我改进
Anthropic发出紧急警告:AI正逼近自我改进临界点
美国AI巨头Anthropic于2026年6月4日发布重磅文章,直言AI系统正以惊人速度进化,即将跨入一个危险的门槛——递归自我改进。这意味着AI能够在几乎无需人类干预的情况下自行提升性能,从而引发不可控的连锁反应。Anthropic研究院负责人马里纳·法瓦罗和联合创始人杰克·克拉克在文中强调,全球社会必须正视这一潜在风险,并考虑放缓或临时暂停前沿AI开发,以便让社会治理和安全研究跟上技术的脚步。
递归自我改进:一场“自己造自己”的赛跑
Anthropic内部数据揭示了一个令人不安的趋势:AI正在加速AI的发展,通往递归自我改进的路径已经浮现。所谓“递归自我改进”,是指AI系统能够自主优化自身代码、发现漏洞并增强能力,形成一种指数级的进化循环。这一机制被视为人工智能跨越人类智慧门槛、引发“智能爆炸”的核心关键。Anthropic认为,当前模型的能力进步已逼近这一临界点,一旦突破,人类可能失去对AI进化的控制权。

全球暂停开发倡议:核武式核查机制能否奏效?
面对这一威胁,Anthropic呼吁全球顶级AI实验室共同商讨放缓策略,并提出建立一套可核查的全球协议,类似于核武器条约。文章指出,暂停或放缓只有在被广泛遵守时才有效,因此需要一个能够监督各国和各大科技公司是否遵守承诺的机制。不过,Anthropic也坦承,相比于核武核查,AI领域的作弊检测将更为棘手。公司计划在未来几个月与政策制定者、研究人员及其他AI公司展开对话,共同研究如何实现这一核查系统,并强调“窗口已经到来,AI公司之外的人士也应参与审议”。
Claude Mythos的惊人能力:是安全守护还是营销噱头?
Anthropic对自身前沿模型Claude Mythos的发布策略,恰恰印证了警告的紧迫性。该模型在预览版测试中展现了超强的自主网络安全能力——能够自行发现并串联多个“零日漏洞”,甚至挖掘出隐藏数十年的系统缺陷。然而,Anthropic并未全面开放,而是通过“Project Glasswing”计划,仅向微软、苹果、亚马逊等约150家大型科技机构和资安组织提供,用于防御性修复。这种“安全优先”的封闭发布,既体现了对模型危险性的担忧,也招致了批评:部分业内人士认为,这本质上是借“安全警告”来营销自身技术实力,并借监管限制竞争对手。
业界分歧与未来博弈:AGI真的来了吗?
对于Anthropic的警告,业内看法不一。前Meta首席AI科学家杨·勒丘恩直言,现有大模型远未达到人类智能水平,其能力更接近“猫的脑力”,递归自我改进仍是遥远神话。而Anthropic首席执行官达里奥·阿莫代伊则多次预警,AI可能加剧不平等,并取代大量初级白领工作。宾夕法尼亚大学教授Ethan Mollick则给出了折中评价:文章中既有真诚的自我反思,也有营销成分,但更重要的是,Anthropic对未来AI发展方向的判断值得关注。这场关于AI是否即将“自我造自我”的争论,正随着技术进步而愈演愈烈。