5000万行代码迁移一天搞定，Anthropic重磅发布Claude Fable 5、Mythos 5

1 个月前

AI资讯

24 阅读

Anthropic AI编程 [代码迁移 Fable5]

5000万行代码一天迁移，Stripe亲测效率碾压

在智能体编程领域，Fable 5交出了令人瞠目的成绩单。它在SWE-Bench Pro榜单上以80.3%的得分大幅领先GPT-5.5（58.6%）和Gemini 3.1 Pro（54.2%），但这只是冰山一角。真正让业界沸腾的是Stripe的实战测试：在一个拥有5000万行Ruby代码的庞大代码库中，Fable 5仅用一天时间就完成了整个代码库的迁移工作。而据估算，如果由一个工程团队手动完成这项任务，至少需要两个多月。GitHub首席产品官Mario Rodriguez在测试后直言：“Fable 5处理复杂、长期编程任务的能力超越了之前的基准。”此外，Fable 5在Cognition的FrontierCode评估中，即使在中等工作量下，也在所有前沿模型中得分最高，token效率远超同类模型。

5000万行代码迁移一天搞定，Anthropic重磅发布Claude Fable 5、Mythos 5

仅凭视觉通关《宝可梦》，视觉与科研领域全面突破

不止于编程，Fable 5在视觉和科研任务上同样展现了惊人的“生态位跃迁”。它能够从复杂科学图表中提取精确数据，甚至仅靠原始游戏截图（无地图、无导航辅助、无额外状态信息）就从头到尾通关了《宝可梦：火红》，而此前的Claude模型即便配备了额外辅助工具也难以做到。在《杀戮尖塔》的长期记忆测试中，为其提供持久文件记忆后，Fable 5的表现提升幅度是Opus 4.8的三倍。Anthropic强调，Fable 5是目前最先进的视觉任务模型。在科研领域，Mythos 5（与Fable 5共享同一底层模型）展现出更直接的转化潜力：公司内部的蛋白质设计专家借助Mythos 5，将药物设计流程的某些环节效率提高了约十倍；在一周多的时间里，Mythos 5几乎可以完全自主开展基因组学研究。

“降维安全学”：将能力与安全拆成两件事

Fable 5的发布策略或许是整场事件中最值得玩味的哲学实验。Claude Fable 5面向普通用户和开发者开放，定位为“目前公开可用能力最强的Claude模型”；而Claude Mythos 5则继续锁定在“受信任的安全合作伙伴”范围内，两者共享同一底层模型架构，真正的分水岭是安全护栏。Fable 5背后挂着一组独立的分类器，一旦判断用户的请求落在网络安全、生化武器或模型蒸馏这三个高风险领域，系统会“悄悄”将请求转交给能力稍弱的Claude Opus 4.8处理，而非直接拒绝。这种做法被业界称为“降维安全学”——用户买的是Mythos级别的能力，但在高风险领域实际与Opus对话。Anthropic声称，超过95%的用户会话不会触发降级，普通用户的体验与Mythos 5几乎没有区别。而对于被误报的合理研究需求（如病毒研究、渗透测试），公司承诺后续会逐步收窄误报范围。

定价精准卡位，IPO叙事背后的商业逻辑

Fable 5的发布绝非单纯的技术迭代，更是一次向资本市场传递信号的IPO关键动作。定价层面，Fable 5输入每百万Token 10美元、输出每百万Token 50美元，正好是Opus 4.8的两倍，不到Claude Mythos Preview定价的一半，也仅为GPT-5.5 Pro的六分之一。这一价位精准卡在了“比上一代贵、比同级别竞品便宜”的区间。同时，从6月23日起，Fable 5将从Pro、Max、Team和Enterprise计划中移出，继续使用需要消耗usage credits，预示着AI消费模式正从“月卡解锁”转向按Token计费的新范式。Anthropic用同一个底层模型塑造了两个版本——Fable（寓言）和Mythos（神话）——精准对应了AI行业在2026年的核心悖论：我们想要神话般的能力，但必须为它戴上寓言的枷锁。这种将“安全”与“能力”拆解为独立维度的产品逻辑，或许比单纯的模型对齐更接近一个可行的大规模解决方案。

5000万行代码迁移一天搞定，Anthropic重磅发布Claude Fable 5、Mythos 5

5000万行代码一天迁移，Stripe亲测效率碾压

仅凭视觉通关《宝可梦》，视觉与科研领域全面突破

“降维安全学”：将能力与安全拆成两件事

定价精准卡位，IPO叙事背后的商业逻辑

链接失效反馈