5000万行代码迁移一天搞定,Anthropic重磅发布Claude Fable 5、Mythos 5

5000万行代码一天迁移,Stripe亲测效率碾压

在智能体编程领域,Fable 5交出了令人瞠目的成绩单。它在SWE-Bench Pro榜单上以80.3%的得分大幅领先GPT-5.5(58.6%)和Gemini 3.1 Pro(54.2%),但这只是冰山一角。真正让业界沸腾的是Stripe的实战测试:在一个拥有5000万行Ruby代码的庞大代码库中,Fable 5仅用一天时间就完成了整个代码库的迁移工作。而据估算,如果由一个工程团队手动完成这项任务,至少需要两个多月。GitHub首席产品官Mario Rodriguez在测试后直言:“Fable 5处理复杂、长期编程任务的能力超越了之前的基准。”此外,Fable 5在Cognition的FrontierCode评估中,即使在中等工作量下,也在所有前沿模型中得分最高,token效率远超同类模型。

5000万行代码迁移一天搞定,Anthropic重磅发布Claude Fable 5、Mythos 5

仅凭视觉通关《宝可梦》,视觉与科研领域全面突破

不止于编程,Fable 5在视觉和科研任务上同样展现了惊人的“生态位跃迁”。它能够从复杂科学图表中提取精确数据,甚至仅靠原始游戏截图(无地图、无导航辅助、无额外状态信息)就从头到尾通关了《宝可梦:火红》,而此前的Claude模型即便配备了额外辅助工具也难以做到。在《杀戮尖塔》的长期记忆测试中,为其提供持久文件记忆后,Fable 5的表现提升幅度是Opus 4.8的三倍。Anthropic强调,Fable 5是目前最先进的视觉任务模型。在科研领域,Mythos 5(与Fable 5共享同一底层模型)展现出更直接的转化潜力:公司内部的蛋白质设计专家借助Mythos 5,将药物设计流程的某些环节效率提高了约十倍;在一周多的时间里,Mythos 5几乎可以完全自主开展基因组学研究。

“降维安全学”:将能力与安全拆成两件事

Fable 5的发布策略或许是整场事件中最值得玩味的哲学实验。Claude Fable 5面向普通用户和开发者开放,定位为“目前公开可用能力最强的Claude模型”;而Claude Mythos 5则继续锁定在“受信任的安全合作伙伴”范围内,两者共享同一底层模型架构,真正的分水岭是安全护栏。Fable 5背后挂着一组独立的分类器,一旦判断用户的请求落在网络安全、生化武器或模型蒸馏这三个高风险领域,系统会“悄悄”将请求转交给能力稍弱的Claude Opus 4.8处理,而非直接拒绝。这种做法被业界称为“降维安全学”——用户买的是Mythos级别的能力,但在高风险领域实际与Opus对话。Anthropic声称,超过95%的用户会话不会触发降级,普通用户的体验与Mythos 5几乎没有区别。而对于被误报的合理研究需求(如病毒研究、渗透测试),公司承诺后续会逐步收窄误报范围。

定价精准卡位,IPO叙事背后的商业逻辑

Fable 5的发布绝非单纯的技术迭代,更是一次向资本市场传递信号的IPO关键动作。定价层面,Fable 5输入每百万Token 10美元、输出每百万Token 50美元,正好是Opus 4.8的两倍,不到Claude Mythos Preview定价的一半,也仅为GPT-5.5 Pro的六分之一。这一价位精准卡在了“比上一代贵、比同级别竞品便宜”的区间。同时,从6月23日起,Fable 5将从Pro、Max、Team和Enterprise计划中移出,继续使用需要消耗usage credits,预示着AI消费模式正从“月卡解锁”转向按Token计费的新范式。Anthropic用同一个底层模型塑造了两个版本——Fable(寓言)和Mythos(神话)——精准对应了AI行业在2026年的核心悖论:我们想要神话般的能力,但必须为它戴上寓言的枷锁。这种将“安全”与“能力”拆解为独立维度的产品逻辑,或许比单纯的模型对齐更接近一个可行的大规模解决方案。