神话级Claude 5，登顶了

1 个月前

AI资讯

58 阅读

AI安全 [claude 5 双生模型玻璃翼计划]

神话级双生模型：一张面孔，两套安全规则

Claude Fable 5与Mythos 5共享同一个底层模型，但面向不同受众。Fable 5是面向大众的通用版，内置了激进的安全分类器：当用户请求涉及网络安全、生物化学与武器相关知识，或试图“蒸馏”模型能力时，分类器自动拦截，将问题转交给稍弱的Claude Opus 4.8回答。Anthropic数据显示，超过95%的日常会话不会触发该分类器，在这些场景下Fable 5性能与无限制版完全一致。Mythos 5则是为经过审核的合作方准备的无限制版本，目前主要开放给通过“玻璃翼计划”与美国政府合作的网络防御者，以及即将通过可信访问计划加入的生物学研究人员，全面释放顶级模型在危险领域的潜力。

从“辅助编码”到“独立施工”：一天干完两个月的活

极长且复杂的软件工程任务是Fable 5的绝对强项。在SWE-bench Pro上它达到80.3%，远超GPT-5.5约58–60%和Claude Opus 4.8约50–55%。在更严苛的FrontierCode Diamond基准测试中，Fable 5得到29.3%，Opus 4.8为13.4%，GPT-5.5仅5.7%。金融科技公司Stripe实测发现，Fable 5在一天内完成了5000万行Ruby代码库的全库迁移，而原本整个团队人工操作需要两个月。有开发者仅用Fable 5一次性自动触发67次工具调用，生成超百万行新代码，新增24个文件，成功完成架构拆分与模块化改造，甚至直接删掉7000行无效代码且系统零故障。

神话级Claude 5，登顶了

能看图识表、靠截图复刻网页，还能闷头通关《宝可梦》

Fable 5的视觉理解能力跃升至新台阶。它不仅能精确读取图表中的密集数据，还能仅凭一张截图重建整个网页的源代码。在极简的纯视觉框架下，Fable 5盯着原始游戏截图就一路击败了《宝可梦火红》，而此前需要借助复杂辅助框架才能勉强通关。通过赋予模型基于文件的持久记忆能力，Fable 5在长达数百万token的长期任务中表现惊人——用户输入一张任务截图，它就能自动规划并交付成品，例如直接生成一个完整的3D世界项目，打开浏览器就能运行。这种“烧token”能力也让使用成本激增：有用户反馈在200美元/月的Claude Max套餐中，Fable 5仅用1分钟消耗约14%的5小时配额，约合1美元/分钟。

自主科研一周，成果超越《科学》论文

Mythos 5在科学研究领域的表现堪称“降维打击”。在蛋白质设计任务中，无人协助的Mythos 5自主完成选择结合位点、运行设计工具、从失败中恢复等全流程，14个靶点中有9个产生极具潜力的药物候选分子。在基因组学方面，Mythos 5在一周多的完全自主工作中梳理了138个动物物种、数百万个单细胞数据，自行设计并训练出机器学习模型，其性能超越了近期发表在《科学》期刊上的一个模型，而参数量仅为后者的百分之一。Anthropic团队正计划在数月内发表这些成果。

价格砍半仍贵到离谱，安全争议伴随登场

Fable 5与Mythos 5的定价为每百万输入token 10美元、每百万输出token 50美元，不到此前Mythos预览版的一半，但依然是全球主流AI模型中最昂贵的之一。Anthropic给出了临时免费窗口：6月9日至22日，Pro、Max、Team和基于席位数的企业用户可免费使用，之后将转为按量消耗。然而，开源模型研究员Nathan Lambert直言，Anthropic成天把安全挂在嘴边，但连圈内人都看得出来这不过是产品的安全包装。与此同时，知名投资人Anish Acharya指出，Anthropic刻意用Fable和Mythos这类品牌名压住模型编号，意在让用户聚焦“最前沿”而非具体代数。

神话级Claude 5，登顶了

神话级双生模型：一张面孔，两套安全规则

从“辅助编码”到“独立施工”：一天干完两个月的活

能看图识表、靠截图复刻网页，还能闷头通关《宝可梦》

自主科研一周，成果超越《科学》论文

价格砍半仍贵到离谱，安全争议伴随登场

链接失效反馈