Claude Fable 5省钱秘诀来了:调成Low档比Opus更便宜

最贵模型登场:Fable 5定价$10/$50,免费窗口到6月22日

Anthropic在6月8日正式发布Claude Fable 5,这是首个面向公众开放的Mythos级模型,输入每百万token收费10美元、输出50美元,恰好是Opus 4.8标准价的两倍,但也比此前Mythos Preview的$25/$125便宜了一半。不过订阅用户有两周免费期:Pro、Max、Team和Enterprise计划从发布日到6月22日可免费使用Fable 5,之后将移出并改为消耗usage credits;API则从首日起按token计费。基准测试上Fable 5全线碾压Opus 4.8,SWE-Bench Pro达80.3%对69.2%,FrontierCode翻倍至29.3%,但安全方面在网络安全、生物等敏感方向会自动降级到Opus 4.8响应。

Claude Fable 5省钱秘诀来了:调成Low档比Opus更便宜

省钱核心:顾问模式让Fable 5只当“参谋”不干活

Anthropic早在两个月前就上线了advisor tool,为昂贵模型找到最舒服的用法——让它当顾问,而不是执行者。具体机制是:一个便宜的executor(如Haiku 4.5或Sonnet 4.6)端到端跑任务——调工具、读结果、迭代;遇到拿不准的决策时,它调用advisor(Opus 4.7/4.8或Fable 5)。advisor读完整个对话记录,输出一段400到700 token的建议(计划、纠偏或停止信号),executor拿着建议继续干活。整个回路在单次API请求内部完成,无需客户端写编排逻辑。计费上,advisor的token按advisor模型费率单独列出,max_uses是主要的成本控制手段。Claude Code里输入/advisor也能直接启用。

为什么“调成Low档比Opus更便宜”?——用量即成本控制

直接使用Opus 4.8执行整个agent任务,每百万输出token要花$25;而Fable 5作为执行模型更是高达$50,长任务token消耗极高,Mollick实测也指出“真正投入生产后成本可能成为最大现实挑战”。但顾问模式彻底逆转了算式:便宜的executor(如Sonnet 4.6,输出$15每百万token)承担95%以上的token输出,Fable 5只在关键决策点输出几百token建议。以一次典型agent任务为例,若executor输出5万token(约$0.75),Fable 5顾问调用10次、每次平均500 token输出(共5000 token,约$0.25),总成本不过$1.00。而同样任务如果用Opus 4.8直接执行,至少$1.25起,且Fable 5顾问还能提供更高判断质量。这就是“调成Low档比Opus更便宜”的实质——不是把Fable 5降级,而是把它钉在最省token的顾问位置上。

跨档配对尚未开放,但免费窗口是绝佳测试期

目前advisor tool的配对有限制:advisor必须不弱于executor。Fable 5发布后进入了兼容表,但目前只支持executor也是Fable 5时才能调用Fable 5当顾问(即对角线上的一格),用户真正想要的组合——Sonnet或Haiku干活、Fable 5当顾问——还未开放。不过有先例可循:Opus 4.8在5月发布后,很快出现在了便宜模型的advisor选项里。考虑到Fable 5的定价和顾问模式高度契合(贵单价×小用量),跨档配对很可能在近期开放。在此之前,订阅用户手中的免费窗口(到6月22日)是测试Fable 5能力上限的唯一低成本机会——在Claude Code里直接调用Fable 5跑复杂任务,或通过/advisor模拟顾问场景,为正式上线后的成本决策积累经验。