Claude深夜炸场，放出史上最强“危险级”模型Fable 5，价格逆天

1 个月前

AI资讯

47 阅读

AI模型 Anthropic claude 5 Fable

凌晨突袭：Anthropic趁夜放出最强模型Fable 5

北京时间6月10日凌晨，Anthropic在没有预热的情况下，突然发布了旗下最强大模型Claude Fable 5（面向公众开放）以及Mythos 5（留于受控项目Project Glasswing）。官方直接亮出多项恐怖跑分，毫无保留地宣告了新一代旗舰的诞生。

跑分碾压：SWE-Bench Pro狂砍80.3%，Terminal-Bench力压OpenAI

Fable 5在SWE-Bench Pro上拿到80.3%，远高于Mythos Preview的77.8%、Opus 4.8的69.2%，以及GPT-5.5的58.6%和Gemini 3.1 Pro的54.2%。在Terminal-Bench 2.1上更是达到88.0%，不仅碾压Opus 4.8（82.7%），还力压OpenAI的Codex CLI组合（GPT-5.5 Codex CLI为83.4%）。这意味着Fable 5在终端环境执行任务、读报错、改代码等方面已是当前最强选手。

断崖式领先：全方位超越DeepSeek V4-Pro Max与GPT-5.5

在更接近真实工程的指标上，Fable 5展现出绝对统治力：

SWE-Bench Pro：Fable 5 80.3%，DeepSeek V4-Pro Max仅55.4%
HLE with tools：Fable 5 64.5%，DeepSeek V4-Pro Max 48.2%
Terminal-Bench 2.1：Fable 5 88.0%，DeepSeek V4-Pro Max在2.0上仅67.9%

Claude深夜炸场，放出史上最强“危险级”模型Fable 5，价格逆天

所有核心任务均实现断崖式领先，将竞品远远甩在身后。

视觉与推理能力暴涨：从截图重建网页，科学图表提取精确数据

Fable 5的视觉和空间推理能力也大幅进化：

GDP.pdf类知识工作视觉任务：Fable 5得分29.8%，高于Opus 4.8、GPT-5.5和Gemini 3.1 Pro
Blueprint-Bench 2：Fable 5达38.6%，远超Opus 4.8的14.5%

Anthropic强调，Fable 5能从截图重建网页应用，从科学图表中提取精确数字，这对知识工作者和开发者而言是质的飞跃。

“危险级”实至名归：网络安全与生物能力令人震惊

Fable 5最让Anthropic不敢完全放开的，是其网络安全和生物能力：

ExploitBench Cap%：Fable 5高达78.0%，Mythos Preview 69.0%，Opus 4.8仅40.0%，GPT-5.5仅34.0%。这意味着模型能更快发现安全漏洞，但落入错误之手也会大幅降低攻击门槛
BioMysteryBench hard：Fable 5达46.1%，Mythos Preview 29.6%，Opus 4.8 40.0%。并且Mythos 5在药物设计流程中带来约10倍加速，分子生物学假设盲测获得研究者偏好比例约80%

这些数据让监管者高度警惕，也解释了为何Fable 5被贴上“危险级”标签。

价格逆天：能力越强，钱包越空

尽管Anthropic尚未公布Fable 5具体定价，但参考Opus 4.8的高昂API费用（每百万token输入约$15、输出约$75），性能全面超越的Fable 5价格将更加惊人。业内人士推测，其API调用费可能达到Opus 4.8的2-3倍，真正实现“强得宛如神话，贵得理所当然”。

Claude深夜炸场，放出史上最强“危险级”模型Fable 5，价格逆天

凌晨突袭：Anthropic趁夜放出最强模型Fable 5

跑分碾压：SWE-Bench Pro狂砍80.3%，Terminal-Bench力压OpenAI

断崖式领先：全方位超越DeepSeek V4-Pro Max与GPT-5.5

视觉与推理能力暴涨：从截图重建网页，科学图表提取精确数据

“危险级”实至名归：网络安全与生物能力令人震惊

价格逆天：能力越强，钱包越空

链接失效反馈