最强Claude意外泄露,完胜Opus 4.6,代号「卡皮巴拉」,奥特曼又要睡不着了

意外泄露:低级错误曝光最强模型

近日,AI安全公司Anthropic遭遇了一次极其尴尬的意外泄露。起因并非高深的黑客攻击,而是一个极其低级的配置错误:其使用的第三方CMS(内容管理系统)工具中,上传的资产默认设置为公开,而相关人员忘记将其设为私密。这一疏忽导致近3000份未发布的内部文件直接暴露在公网上,被外界轻松获取。

泄露的内容中,最重磅的当属关于一款名为Claude Mythos的新模型的详细信息。除了模型细节,泄露文件还包含了员工的育儿假文件以及一场计划在英国18世纪乡间庄园举办的CEO闭门峰会信息。剑桥大学网络安全研究员Alexandre Pauwels受邀验证了材料的真实性,Anthropic发言人随后也确认了该模型的存在,但强调这些仅为“考虑发布的早期草稿”,并未涉及核心基础设施或客户数据。

性能炸裂:全面超越Opus 4.6

泄露的内部草稿博文揭示了Mythos的惊人能力。Anthropic计划直接跳过Opus升级版的剧本,将Mythos定位为凌驾于Opus之上的全新“第四层级”模型。官方内部原话是:“Mythos是一个全新层级模型的名字,比我们的Opus模型更大、更智能。”

最强Claude意外泄露,完胜Opus 4.6,代号「卡皮巴拉」,奥特曼又要睡不着了

具体来说,Mythos在多个核心领域实现了对当前王者Claude Opus 4.6的显著超越:

  • 软件编程:在当前竞争最白热化的编程领域,Mythos相比Opus 4.6实现了“量级的跃升”,而非小数点后的微调。
  • 学术推理:在数学、科学、逻辑等考验深度思考的“硬骨头”上,Mythos同样显著领先,被作为独立测试维度重点强调。
  • 网络安全:内部评估用词极重,称其“远超任何其他AI模型”。

顶级安全风险:先发解药,后放毒药

Mythos最令人震惊的能力在于网络安全。内部文档中有一段措辞极重的描述:“尽管Mythos目前在网络安全能力上远超任何其他AI模型,但它预示着即将到来的一波浪潮,届时模型将能以远超防御者努力的速度来利用漏洞。”

基于这种“造物主都被吓到”的潜在风险,Anthropic做出了一个在AI行业发布史上几乎没有先例的决定:让网络安全防御机构成为Mythos的第一批用户。 这被视为“防御者优先”策略,旨在让防守方先拿到这把“神兵利器”,以便在攻击者利用漏洞之前修补防线。这种“解药先行”的做法,既是对模型能力的侧面佐证,也体现了Anthropic在安全上的极端谨慎。

撞名与命名:卡皮巴拉与Mythos

泄露文件还曝光了一个有趣的细节:该模型在Anthropic内部的长期代号是“Capybara”(卡皮巴拉),即那个以“呆萌脸+跟谁都好”闻名的水豚。泄露的博客草稿有两个版本,V1全篇使用“Mythos”,V2则将所有“Mythos”替换为“Capybara”。这证实了Capybara是内部代号,而Mythos是准备对外发布的正式名称。耐人寻味的是,阿里巴巴通义千问的大模型吉祥物也是一只水豚,此番撞车引发了不少讨论。

讽刺的背影:最强AI被最基础错误出卖

最具讽刺意味的是,一家正在打造史上最强网络安全AI的公司,却因为最基础的权限配置疏忽而曝光了所有敏感内容。这被戏称为“最讽刺的剧本”。

Anthropic发言人特意澄清,这起事故“跟Claude、Cowork或任何AI工具无关”,急于甩锅的意味明显。这也侧面反映出,尽管AI能力越来越强,但人类的基础运维失误依然是巨大的安全隐患。随着Mythos以“卡皮巴拉”之名浮出水面,OpenAI的Sam Altman恐怕又要面临一场激烈的竞争了。