公开版Mythos上线，Claude 最强模型开始分层发售

1 个月前

AI资讯

28 阅读

AI模型 [claude Mythos 性能评测]

一夜封神：跑分碾压 Opus，数学代码双双登顶

Anthropic 最新发布的 Claude Mythos 预览版被官方称为“迄今为止最强大的 AI 模型”，其性能直接甩开此前旗舰 Opus 4.6 一个层级。在面向软件工程的核心测试 SWE-bench Verified 上，Mythos 得分从 Opus 4.6 的 80.8% 暴涨至 93.9%；SWE-bench Pro 从 53.4% 猛冲到 77.8%。更惊人的是高难度数学推理 USAMO 2026 测试，成绩从 42.3% 直接飙升到 97.6%，几乎满分。这一成绩不仅大幅领先自家模型，也让所有公开评测的竞品望尘莫及。

藏了 27 年的漏洞，被 AI 一夜揪出

Mythos 预览版最让安全圈震撼的是其自主发现漏洞的能力。在 OpenBSD 系统里，它找到了一个隐藏长达 27 年未被发现的远程崩溃漏洞；而在针对 Mozilla Firefox 147 JavaScript 引擎漏洞的利用测试中，Claude Opus 4.6 尝试数百次只成功 2 次，Mythos 预览版却成功利用了 181 次。Anthropic 官方直言，Mythos 在网络安全能力上远超市面上任何其他 AI 模型，甚至能自动开发专业水准的攻击手段。这种能力让公开发布变得极为敏感——一旦落入攻击者手中，全球数字基础设施将面临严重风险。

玻璃翼计划：先给防御者发武器，再让公众用上

为了管理这种颠覆性风险，Anthropic 同步启动了 Project Glasswing（玻璃翼计划）。逻辑很简单：让防御方先用上最强 AI，在攻击方拿到同级别工具之前把漏洞全部堵上。Anthropic 砸下 1 亿美元额度，支持包括苹果、微软、亚马逊在内的 40 多家组织率先使用 Mythos 预览版维护开源生态“地基”。团队还展示了一个开源漏洞面板，汇总 Mythos 发现的不同严重等级漏洞。Anthropic 官方表态明确：最终目标仍是要让用户能够安全地大规模部署 Mythos 级模型——但前提是先通过玻璃翼计划做好安全防线。

分层发售信号：短暂现身 Claude Code，公众或分阶段解锁

尽管官方表示“目前没有计划向公众开放”，但科技媒体在 Claude Code 和 Claude Security 的公开版本中曾短暂发现名为“claude-mythos-1-preview”的模型选项，随后又被撤下。这一迹象表明 Anthropic 很可能已进入上线前测试阶段，正在为分层发售铺路。有分析认为，从今年 2 月开始 Claude Code 用户就频繁抱怨性能“史诗级削弱”，原因正是顶级 GPU 被 Mythos 训练和测试占用。Mythos 预览版不面向公众开放，反而避免了算力进一步稀释，保障了现有 Claude 用户的服务质量。未来 Anthropic 很可能按照安全等级、组织资质或订阅层级，逐步释放 Mythos 的能力——从安全合作伙伴到企业用户，再到普通订阅者，实现真正的分层发售。

公开版Mythos上线，Claude 最强模型开始分层发售

一夜封神：跑分碾压 Opus，数学代码双双登顶

藏了 27 年的漏洞，被 AI 一夜揪出

玻璃翼计划：先给防御者发武器，再让公众用上

分层发售信号：短暂现身 Claude Code，公众或分阶段解锁

链接失效反馈