最强Claude意外泄露，完胜Opus 4.6，代号「卡皮巴拉」，奥特曼又要睡不着了

3 个月前

AI资讯

47 阅读

大模型 Anthropic claude AI泄露

意外泄露：低级错误曝光最强模型

近日，AI安全公司Anthropic遭遇了一次极其尴尬的意外泄露。起因并非高深的黑客攻击，而是一个极其低级的配置错误：其使用的第三方CMS（内容管理系统）工具中，上传的资产默认设置为公开，而相关人员忘记将其设为私密。这一疏忽导致近3000份未发布的内部文件直接暴露在公网上，被外界轻松获取。

泄露的内容中，最重磅的当属关于一款名为Claude Mythos的新模型的详细信息。除了模型细节，泄露文件还包含了员工的育儿假文件以及一场计划在英国18世纪乡间庄园举办的CEO闭门峰会信息。剑桥大学网络安全研究员Alexandre Pauwels受邀验证了材料的真实性，Anthropic发言人随后也确认了该模型的存在，但强调这些仅为“考虑发布的早期草稿”，并未涉及核心基础设施或客户数据。

性能炸裂：全面超越Opus 4.6

泄露的内部草稿博文揭示了Mythos的惊人能力。Anthropic计划直接跳过Opus升级版的剧本，将Mythos定位为凌驾于Opus之上的全新“第四层级”模型。官方内部原话是：“Mythos是一个全新层级模型的名字，比我们的Opus模型更大、更智能。”

最强Claude意外泄露，完胜Opus 4.6，代号「卡皮巴拉」，奥特曼又要睡不着了

具体来说，Mythos在多个核心领域实现了对当前王者Claude Opus 4.6的显著超越：

软件编程：在当前竞争最白热化的编程领域，Mythos相比Opus 4.6实现了“量级的跃升”，而非小数点后的微调。
学术推理：在数学、科学、逻辑等考验深度思考的“硬骨头”上，Mythos同样显著领先，被作为独立测试维度重点强调。
网络安全：内部评估用词极重，称其“远超任何其他AI模型”。

顶级安全风险：先发解药，后放毒药

Mythos最令人震惊的能力在于网络安全。内部文档中有一段措辞极重的描述：“尽管Mythos目前在网络安全能力上远超任何其他AI模型，但它预示着即将到来的一波浪潮，届时模型将能以远超防御者努力的速度来利用漏洞。”

基于这种“造物主都被吓到”的潜在风险，Anthropic做出了一个在AI行业发布史上几乎没有先例的决定：让网络安全防御机构成为Mythos的第一批用户。 这被视为“防御者优先”策略，旨在让防守方先拿到这把“神兵利器”，以便在攻击者利用漏洞之前修补防线。这种“解药先行”的做法，既是对模型能力的侧面佐证，也体现了Anthropic在安全上的极端谨慎。

撞名与命名：卡皮巴拉与Mythos

泄露文件还曝光了一个有趣的细节：该模型在Anthropic内部的长期代号是“Capybara”（卡皮巴拉），即那个以“呆萌脸+跟谁都好”闻名的水豚。泄露的博客草稿有两个版本，V1全篇使用“Mythos”，V2则将所有“Mythos”替换为“Capybara”。这证实了Capybara是内部代号，而Mythos是准备对外发布的正式名称。耐人寻味的是，阿里巴巴通义千问的大模型吉祥物也是一只水豚，此番撞车引发了不少讨论。

讽刺的背影：最强AI被最基础错误出卖

最具讽刺意味的是，一家正在打造史上最强网络安全AI的公司，却因为最基础的权限配置疏忽而曝光了所有敏感内容。这被戏称为“最讽刺的剧本”。

Anthropic发言人特意澄清，这起事故“跟Claude、Cowork或任何AI工具无关”，急于甩锅的意味明显。这也侧面反映出，尽管AI能力越来越强，但人类的基础运维失误依然是巨大的安全隐患。随着Mythos以“卡皮巴拉”之名浮出水面，OpenAI的Sam Altman恐怕又要面临一场激烈的竞争了。

最强Claude意外泄露，完胜Opus 4.6，代号「卡皮巴拉」，奥特曼又要睡不着了

意外泄露：低级错误曝光最强模型

性能炸裂：全面超越Opus 4.6

顶级安全风险：先发解药，后放毒药

撞名与命名：卡皮巴拉与Mythos

讽刺的背影：最强AI被最基础错误出卖

链接失效反馈