公开版Mythos上线,Claude 最强模型开始分层发售

一夜封神:跑分碾压 Opus,数学代码双双登顶

Anthropic 最新发布的 Claude Mythos 预览版被官方称为“迄今为止最强大的 AI 模型”,其性能直接甩开此前旗舰 Opus 4.6 一个层级。在面向软件工程的核心测试 SWE-bench Verified 上,Mythos 得分从 Opus 4.6 的 80.8% 暴涨至 93.9%;SWE-bench Pro 从 53.4% 猛冲到 77.8%。更惊人的是高难度数学推理 USAMO 2026 测试,成绩从 42.3% 直接飙升到 97.6%,几乎满分。这一成绩不仅大幅领先自家模型,也让所有公开评测的竞品望尘莫及。

藏了 27 年的漏洞,被 AI 一夜揪出

Mythos 预览版最让安全圈震撼的是其自主发现漏洞的能力。在 OpenBSD 系统里,它找到了一个隐藏长达 27 年未被发现的远程崩溃漏洞;而在针对 Mozilla Firefox 147 JavaScript 引擎漏洞的利用测试中,Claude Opus 4.6 尝试数百次只成功 2 次,Mythos 预览版却成功利用了 181 次。Anthropic 官方直言,Mythos 在网络安全能力上远超市面上任何其他 AI 模型,甚至能自动开发专业水准的攻击手段。这种能力让公开发布变得极为敏感——一旦落入攻击者手中,全球数字基础设施将面临严重风险。

玻璃翼计划:先给防御者发武器,再让公众用上

为了管理这种颠覆性风险,Anthropic 同步启动了 Project Glasswing(玻璃翼计划)。逻辑很简单:让防御方先用上最强 AI,在攻击方拿到同级别工具之前把漏洞全部堵上。Anthropic 砸下 1 亿美元额度,支持包括苹果、微软、亚马逊在内的 40 多家组织率先使用 Mythos 预览版维护开源生态“地基”。团队还展示了一个开源漏洞面板,汇总 Mythos 发现的不同严重等级漏洞。Anthropic 官方表态明确:最终目标仍是要让用户能够安全地大规模部署 Mythos 级模型——但前提是先通过玻璃翼计划做好安全防线。

分层发售信号:短暂现身 Claude Code,公众或分阶段解锁

尽管官方表示“目前没有计划向公众开放”,但科技媒体在 Claude Code 和 Claude Security 的公开版本中曾短暂发现名为“claude-mythos-1-preview”的模型选项,随后又被撤下。这一迹象表明 Anthropic 很可能已进入上线前测试阶段,正在为分层发售铺路。有分析认为,从今年 2 月开始 Claude Code 用户就频繁抱怨性能“史诗级削弱”,原因正是顶级 GPU 被 Mythos 训练和测试占用。Mythos 预览版不面向公众开放,反而避免了算力进一步稀释,保障了现有 Claude 用户的服务质量。未来 Anthropic 很可能按照安全等级、组织资质或订阅层级,逐步释放 Mythos 的能力——从安全合作伙伴到企业用户,再到普通订阅者,实现真正的分层发售。