Claude深夜炸场,放出史上最强“危险级”模型Fable 5,价格逆天
凌晨突袭:Anthropic趁夜放出最强模型Fable 5
北京时间6月10日凌晨,Anthropic在没有预热的情况下,突然发布了旗下最强大模型Claude Fable 5(面向公众开放)以及Mythos 5(留于受控项目Project Glasswing)。官方直接亮出多项恐怖跑分,毫无保留地宣告了新一代旗舰的诞生。
跑分碾压:SWE-Bench Pro狂砍80.3%,Terminal-Bench力压OpenAI
Fable 5在SWE-Bench Pro上拿到80.3%,远高于Mythos Preview的77.8%、Opus 4.8的69.2%,以及GPT-5.5的58.6%和Gemini 3.1 Pro的54.2%。在Terminal-Bench 2.1上更是达到88.0%,不仅碾压Opus 4.8(82.7%),还力压OpenAI的Codex CLI组合(GPT-5.5 Codex CLI为83.4%)。这意味着Fable 5在终端环境执行任务、读报错、改代码等方面已是当前最强选手。
断崖式领先:全方位超越DeepSeek V4-Pro Max与GPT-5.5
在更接近真实工程的指标上,Fable 5展现出绝对统治力:
- SWE-Bench Pro:Fable 5 80.3%,DeepSeek V4-Pro Max仅55.4%
- HLE with tools:Fable 5 64.5%,DeepSeek V4-Pro Max 48.2%
- Terminal-Bench 2.1:Fable 5 88.0%,DeepSeek V4-Pro Max在2.0上仅67.9%

所有核心任务均实现断崖式领先,将竞品远远甩在身后。
视觉与推理能力暴涨:从截图重建网页,科学图表提取精确数据
Fable 5的视觉和空间推理能力也大幅进化:
- GDP.pdf类知识工作视觉任务:Fable 5得分29.8%,高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro
- Blueprint-Bench 2:Fable 5达38.6%,远超Opus 4.8的14.5%
Anthropic强调,Fable 5能从截图重建网页应用,从科学图表中提取精确数字,这对知识工作者和开发者而言是质的飞跃。
“危险级”实至名归:网络安全与生物能力令人震惊
Fable 5最让Anthropic不敢完全放开的,是其网络安全和生物能力:
- ExploitBench Cap%:Fable 5高达78.0%,Mythos Preview 69.0%,Opus 4.8仅40.0%,GPT-5.5仅34.0%。这意味着模型能更快发现安全漏洞,但落入错误之手也会大幅降低攻击门槛
- BioMysteryBench hard:Fable 5达46.1%,Mythos Preview 29.6%,Opus 4.8 40.0%。并且Mythos 5在药物设计流程中带来约10倍加速,分子生物学假设盲测获得研究者偏好比例约80%
这些数据让监管者高度警惕,也解释了为何Fable 5被贴上“危险级”标签。
价格逆天:能力越强,钱包越空
尽管Anthropic尚未公布Fable 5具体定价,但参考Opus 4.8的高昂API费用(每百万token输入约$15、输出约$75),性能全面超越的Fable 5价格将更加惊人。业内人士推测,其API调用费可能达到Opus 4.8的2-3倍,真正实现“强得宛如神话,贵得理所当然”。