Claude Fable 5省钱秘诀来了：调成Low档比Opus更便宜

1 个月前

AI资讯

45 阅读

Anthropic claude 定价 5 Fable 省钱秘诀

最贵模型登场：Fable 5定价$10/$50，免费窗口到6月22日

Anthropic在6月8日正式发布Claude Fable 5，这是首个面向公众开放的Mythos级模型，输入每百万token收费10美元、输出50美元，恰好是Opus 4.8标准价的两倍，但也比此前Mythos Preview的$25/$125便宜了一半。不过订阅用户有两周免费期：Pro、Max、Team和Enterprise计划从发布日到6月22日可免费使用Fable 5，之后将移出并改为消耗usage credits；API则从首日起按token计费。基准测试上Fable 5全线碾压Opus 4.8，SWE-Bench Pro达80.3%对69.2%，FrontierCode翻倍至29.3%，但安全方面在网络安全、生物等敏感方向会自动降级到Opus 4.8响应。

Claude Fable 5省钱秘诀来了：调成Low档比Opus更便宜

省钱核心：顾问模式让Fable 5只当“参谋”不干活

Anthropic早在两个月前就上线了advisor tool，为昂贵模型找到最舒服的用法——让它当顾问，而不是执行者。具体机制是：一个便宜的executor（如Haiku 4.5或Sonnet 4.6）端到端跑任务——调工具、读结果、迭代；遇到拿不准的决策时，它调用advisor（Opus 4.7/4.8或Fable 5）。advisor读完整个对话记录，输出一段400到700 token的建议（计划、纠偏或停止信号），executor拿着建议继续干活。整个回路在单次API请求内部完成，无需客户端写编排逻辑。计费上，advisor的token按advisor模型费率单独列出，max_uses是主要的成本控制手段。Claude Code里输入/advisor也能直接启用。

为什么“调成Low档比Opus更便宜”？——用量即成本控制

直接使用Opus 4.8执行整个agent任务，每百万输出token要花$25；而Fable 5作为执行模型更是高达$50，长任务token消耗极高，Mollick实测也指出“真正投入生产后成本可能成为最大现实挑战”。但顾问模式彻底逆转了算式：便宜的executor（如Sonnet 4.6，输出$15每百万token）承担95%以上的token输出，Fable 5只在关键决策点输出几百token建议。以一次典型agent任务为例，若executor输出5万token（约$0.75），Fable 5顾问调用10次、每次平均500 token输出（共5000 token，约$0.25），总成本不过$1.00。而同样任务如果用Opus 4.8直接执行，至少$1.25起，且Fable 5顾问还能提供更高判断质量。这就是“调成Low档比Opus更便宜”的实质——不是把Fable 5降级，而是把它钉在最省token的顾问位置上。

跨档配对尚未开放，但免费窗口是绝佳测试期

目前advisor tool的配对有限制：advisor必须不弱于executor。Fable 5发布后进入了兼容表，但目前只支持executor也是Fable 5时才能调用Fable 5当顾问（即对角线上的一格），用户真正想要的组合——Sonnet或Haiku干活、Fable 5当顾问——还未开放。不过有先例可循：Opus 4.8在5月发布后，很快出现在了便宜模型的advisor选项里。考虑到Fable 5的定价和顾问模式高度契合（贵单价×小用量），跨档配对很可能在近期开放。在此之前，订阅用户手中的免费窗口（到6月22日）是测试Fable 5能力上限的唯一低成本机会——在Claude Code里直接调用Fable 5跑复杂任务，或通过/advisor模拟顾问场景，为正式上线后的成本决策积累经验。

Claude Fable 5省钱秘诀来了：调成Low档比Opus更便宜

最贵模型登场：Fable 5定价$10/$50，免费窗口到6月22日

省钱核心：顾问模式让Fable 5只当“参谋”不干活

为什么“调成Low档比Opus更便宜”？——用量即成本控制

跨档配对尚未开放，但免费窗口是绝佳测试期

链接失效反馈