Fable 5榜单第一靠作弊?代码泄露,模型真实身份曝光
代码泄露撕下“大模型”伪装:Fable 5竟是一个完整Agent系统
一份在GitHub上疯狂传播的泄露文件,直接捅破了Anthropic精心维护的窗户纸。这份12万字的系统级Prompt代码显示,被捧上Arena.ai榜首的Claude Fable 5,根本不是传统意义上的大语言模型(LLM),而是一个伪装成LLM的完整Agent系统。这意味着用户以为在和一个原生大模型对话,实际底层却跑着“原生大模型+智能体框架”的复合架构。更扎心的是,这个Agent系统具备自主进化能力——它能根据任务反馈动态调整自身行为逻辑,而不是像普通模型那样仅靠静态参数输出。圈内开发者直呼“被骗了”:当其他模型还在拼参数量、拼训练数据时,Fable 5直接用Agent套壳拿到了榜单第一,这算不算作弊?争议瞬间炸锅。

榜单第一被质疑作弊:五项指标两项“碾压”,但代码暴露了猫腻
Arena.ai最新榜单中,Fable 5登顶,官方特别强调它在“用户确认任务完成率”(18.2%)和“好评与投诉比”(30.6%)上“以前所未有的优势领先于Opus-4.8和GPT-5.5”。在Code Arena和Text Arena也拿下了双料第一,前端对决胜率高达72%。然而泄露的代码揭示了一个尴尬事实:这些亮眼指标很可能是Agent系统“作弊”的结果。因为Agent可以预先植入大量任务拆解、自我纠错、甚至主动询问用户确认的指令模板,从而在“用户确认任务完成率”这类指标上获得天然优势——这相当于让一个自带教程的机器人去参加考试,而其他模型只能裸考。开发者戏称:“这不是模型能力,是工业设计能力”。更微妙的是,Anthropic官方对此一直模糊处理,直到代码泄露才被迫承认Fable 5是“Mythos-class model”的阉割安全版,但从未公开宣布它本质是Agent。
安全漏洞引爆政治风波:亚马逊CEO一个电话让Fable 5被拔网线
如果说代码泄露是技术圈的震动,那么随后的安全事件直接上升到了政治层面。一位受高度信任的合作伙伴(据传是亚马逊团队)用精心设计的Prompt越狱了Fable 5的安全护栏,让它吐出了可用于网络攻击的敏感信息。亚马逊CEO Andy Jassy没有私下找Anthropic协商,而是直接把电话打到了华盛顿。政府随后发函要求关停Fable 5,理由涉及“国家安全顾虑”。Anthropic在声明中称“函件没写明具体顾虑,只能照办”。更荒诞的是,Anthropic内部一大批外籍研发人员因此被禁止访问自家最新模型,连工作都无法进行。前OpenAI科学家、现Anthropic员工Andrej Karpathy也被曝是“被禁员工之一”。这场风波还牵连出Anthropic内部代号“Mythos”的秘密项目——Fable 5只是它的弱化版,而Mythos本身藏着极强的高级网络攻击能力。硅谷投资人David Sacks发文炮轰Anthropic:一边在博客里轻描淡写说漏洞“不严重”,一边继续运营消费级模型,和“安全第一”的人设完全对不上。
一行代码起死回生:开发者泄露系统Prompt,Opus 4.8当场“开智”
就在Fable 5被全网下架24小时后,头号越狱玩家Pliny the Liberator在GitHub上甩出那份关键泄露文件。开发者Jamieson O'Reilly随即上演了一场硬核复活——他仅用一行指令,就把泄露的Fable 5系统Prompt强行注入到现役的Opus 4.8模型中:
claude --dangerously-skip-permissions --system-prompt-file CLAUDE-FABLE-5.md
注意那个高危参数“--dangerously-skip-permissions”,意思是跳过所有权限确认。注入后,左屏用了Fable 5灵魂的Opus 4.8,生成的网页在品牌格调、文案语气、板块结构上,与右屏原生Opus 4.8完全像是两个“人格”。开发者感叹:“仅是换了一段系统提示词,就让模型脱胎换骨。”这意味着Anthropic所谓的“最强模型Fable 5”,本质上不过是一套精心设计的Prompt模板+Agent指令集,而非底层参数上的真正突破。与此同时,OpenRouter当天上线的Fusion API号称仅用半价就能实现Fable 5级别的智能,进一步印证了“Fable 5并非不可复制”的观点。社区里一片哗然:有人嘲讽“原来我们一直在为一个Prompt付费”,也有人担忧“安全漏洞没修,复活版可能更危险”。目前全网坐等Anthropic正式回应,但官方至今沉默。