神话级Claude 5,登顶了

神话级双生模型:一张面孔,两套安全规则

Claude Fable 5与Mythos 5共享同一个底层模型,但面向不同受众。Fable 5是面向大众的通用版,内置了激进的安全分类器:当用户请求涉及网络安全、生物化学与武器相关知识,或试图“蒸馏”模型能力时,分类器自动拦截,将问题转交给稍弱的Claude Opus 4.8回答。Anthropic数据显示,超过95%的日常会话不会触发该分类器,在这些场景下Fable 5性能与无限制版完全一致。Mythos 5则是为经过审核的合作方准备的无限制版本,目前主要开放给通过“玻璃翼计划”与美国政府合作的网络防御者,以及即将通过可信访问计划加入的生物学研究人员,全面释放顶级模型在危险领域的潜力。

从“辅助编码”到“独立施工”:一天干完两个月的活

极长且复杂的软件工程任务是Fable 5的绝对强项。在SWE-bench Pro上它达到80.3%,远超GPT-5.5约58–60%和Claude Opus 4.8约50–55%。在更严苛的FrontierCode Diamond基准测试中,Fable 5得到29.3%,Opus 4.8为13.4%,GPT-5.5仅5.7%。金融科技公司Stripe实测发现,Fable 5在一天内完成了5000万行Ruby代码库的全库迁移,而原本整个团队人工操作需要两个月。有开发者仅用Fable 5一次性自动触发67次工具调用,生成超百万行新代码,新增24个文件,成功完成架构拆分与模块化改造,甚至直接删掉7000行无效代码且系统零故障。

神话级Claude 5,登顶了

能看图识表、靠截图复刻网页,还能闷头通关《宝可梦》

Fable 5的视觉理解能力跃升至新台阶。它不仅能精确读取图表中的密集数据,还能仅凭一张截图重建整个网页的源代码。在极简的纯视觉框架下,Fable 5盯着原始游戏截图就一路击败了《宝可梦 火红》,而此前需要借助复杂辅助框架才能勉强通关。通过赋予模型基于文件的持久记忆能力,Fable 5在长达数百万token的长期任务中表现惊人——用户输入一张任务截图,它就能自动规划并交付成品,例如直接生成一个完整的3D世界项目,打开浏览器就能运行。这种“烧token”能力也让使用成本激增:有用户反馈在200美元/月的Claude Max套餐中,Fable 5仅用1分钟消耗约14%的5小时配额,约合1美元/分钟。

自主科研一周,成果超越《科学》论文

Mythos 5在科学研究领域的表现堪称“降维打击”。在蛋白质设计任务中,无人协助的Mythos 5自主完成选择结合位点、运行设计工具、从失败中恢复等全流程,14个靶点中有9个产生极具潜力的药物候选分子。在基因组学方面,Mythos 5在一周多的完全自主工作中梳理了138个动物物种、数百万个单细胞数据,自行设计并训练出机器学习模型,其性能超越了近期发表在《科学》期刊上的一个模型,而参数量仅为后者的百分之一。Anthropic团队正计划在数月内发表这些成果。

价格砍半仍贵到离谱,安全争议伴随登场

Fable 5与Mythos 5的定价为每百万输入token 10美元、每百万输出token 50美元,不到此前Mythos预览版的一半,但依然是全球主流AI模型中最昂贵的之一。Anthropic给出了临时免费窗口:6月9日至22日,Pro、Max、Team和基于席位数的企业用户可免费使用,之后将转为按量消耗。然而,开源模型研究员Nathan Lambert直言,Anthropic成天把安全挂在嘴边,但连圈内人都看得出来这不过是产品的安全包装。与此同时,知名投资人Anish Acharya指出,Anthropic刻意用Fable和Mythos这类品牌名压住模型编号,意在让用户聚焦“最前沿”而非具体代数。