仅一行代码,Fable 5复活了

1 小时前
1 阅读

一行代码注入,Opus 4.8秒变Fable 5

Fable 5诞生的24小时内,头号越狱玩家Pliny the Liberator就在GitHub上甩出重磅文件,记录了Fable 5的系统级提示词。开发者Jamieson O'Reilly仅用一条指令,就让现役的Opus 4.8当场“开智”:打开Claude Code,敲下 claude --dangerously-skip-permissions --system-prompt-file CLAUDE-FABLE-5.md。这个参数是官方标红的高危开关,跳过所有权限确认。对比实验发现,同一个大脑、同样的上下文,仅仅换了那段系统提示词,两个网页在品牌格调、文案语气、板块结构上全线分化——版式、措辞、模块拆法,处处透出“出厂人格”的烙印。全网玩家借这份文档,让Fable 5借尸还魂。

金主反手一刀:亚马逊CEO直通华盛顿

事件起因于一次内部安全测试。亚马逊团队用一串精心设计的prompt绕过了Fable 5的安全护栏,让它吐出了本该被锁死的、可用于网络攻击的敏感信息。拿到结果后,CEO Andy Jassy没有私下找Anthropic打招呼,而是直接把电话打给了华盛顿。政府随即出手,要求Anthropic关停Fable 5。曾被称为“头号金主”的亚马逊,反手一刀成为背后推手。

全球拔网线:90分钟紧急下架

Anthropic在声明中称,政府函件未写明国家安全顾虑的具体内容,只能照办。自接到通知起,全球范围内对Fable 5的访问权限在90分钟内被彻底切断。更荒诞的是,Anthropic内部一大批外籍研发人员,因这道禁令连自家最新模型的门都进不去,工作无法开展。甚至AI社区知名人物Karpathy也在此次被禁之列。

Dario硬刚:拒改Bug引发风波

Fable 5的核心“Mythos”藏着极强的网络攻击能力,护栏的作用就是锁住这身“武器”。一位受高度信任的合作伙伴在测试时拿出了能破开护栏的越狱方案,但Anthropic创始人Dario拒绝修补这个漏洞。在Sacks的长文中,火力全开指责Anthropic一边在博客里轻描淡写说漏洞“不严重”,一边继续运营消费级模型,与“安全第一”的人设完全不符。政府表示很不情愿动用禁令,也很震惊Anthropic连“修个漏洞”这种合理诉求都不肯配合。最扎心的是,他们指出同样手法在其他公开模型上一样能复现,包括OpenAI的GPT-5.5。

安全与能力的悖论:潘多拉盒子已开

一个模型能力强大到“护栏被撬开”就等同于“能力失控”。Fable 5可以一夜下架,但潘多拉的盒子从来不会“暂时不可用”。与此同时,OpenRouter上线的Fusion API仅用半价就实现了Fable 5级别的智能,进一步印证了:越狱后的能力正在以更廉价的方式涌入市场。安全与能力的天平已悬到前所未有的高度,“弃考但排名第一”的荒诞结果背后,是整个AI行业被撕裂的根本矛盾。