「AI几小时攻破NSA」刷屏,真相竟是一场红队演习?

一句话如何从国会传遍全网

事件的起点是《经济学人》一篇讨论AI监管的文章。作者为说明Anthropic最强模型Mythos的能力,引用了参议院情报委员会副主席Mark Warner的一句话,而这句话又来自同时执掌NSA和五角大楼网络司令部的局长Joshua Rudd。原文大意是“Mythos几小时攻破NSA系统”——没有限定条件、没有上下文。这粒火星迅速在英文社交媒体上引爆,演变成「AI几小时攻破NSA机密系统」的突发新闻。

作者事后承认这是自己的疏忽:Mythos是在非常特定的条件下、配合其他工具一起才做到的,写文章时为了突出模型强大,没加上限定词。安全分析师Kyle Chase则点明,那场“攻破”本质上是一次测试——一句原本意在呼吁“该对前沿模型上强制测试”的话,经过参议员、记者、社交平台的接力,彻底变味。

玻璃翼计划:红队演习的真实面貌

Anthropic为Mythos设立了专门的“玻璃翼计划”(Project Glasswing),模型不公开发售,只发给过审的防御方。首批约50家机构,AWS、苹果、谷歌、微软、英伟达、摩根大通都在列;6月2日名单扩大到15个以上国家的约150家机构。这些机构拿到的Mythos权限,主要用途是扫自家环境、提前挑出可能被利用的漏洞,并非去攻击别人正在运行的生产系统。

「AI几小时攻破NSA」刷屏,真相竟是一场红队演习?

Rudd局长所说的“攻破”指的是一次授权的红队演练:NSA把Mythos放进自家机密环境的副本里,让它去找、去串漏洞,它以远超人类团队的速度做到了。红队演练的本质是“请来的人,在自己的靶场里、得到授权地打你自己的墙”——把消防演习写成大楼着火,是这次谣言的错位。

特朗普态度反转与出口管制的戏剧性转折

就在谣言满天飞的同时,真实的政治博弈也在上演。今年2月五角大楼切断与Anthropic的合作,理由是该公司是“供应链风险”,官司持续至今。但6月19日,特朗普总统在接受专访时改口:当被问及“你把Anthropic看成国家安全威胁吗?”他回答“现在不是了,但一周前,也许是”。

这个180度转弯背后有一个导火索:Anthropic股东亚马逊递交一份漏洞报告,惊动了白宫。政府拿着报告去找Anthropic高层,却觉得对方没当回事。6月12日,Anthropic收到一纸出口管制令,禁止任何外国人访问Fable 5和Mythos 5,连公司自己的外籍员工都不例外。Anthropic被迫一刀切,对全球用户关停这两个模型。

更拧巴的是,据Axios报道,就在打官司的同时,NSA仍在使用Anthropic最强的Mythos Preview——国防部一边在法庭上主张用它会威胁国家安全,下属的NSA一边照样在用。

Mythos的真实能力与现实边界

Mythos到底有多强?公开信息指向三件事:找漏洞、推理攻击路径、在红队环境里跑测试。Firefox 150版本包含271个由Mythos Preview初始评估识别的漏洞修复,说明AI安全研究已进入主流软件修复流程。但正如安全专家强调:能在受控靶场里几小时突破一套复杂防御,和真把NSA的机密系统打穿,中间隔着一整套前提——特定环境、特定授权、特定工具链。

出口管制能停掉Mythos 5的全球访问,但停不掉“AI能几小时找穿一套防御”这件事背后的能力。红队测试本身正从一次性演练走向常态化:安全的闭环需要私有用例集、持续轮换、多源对照,以及关注业务相关性。那些把测试当作“大楼着火”来传播的人,恰恰忽略了AI安全最需要的是扎实的工程化验证,而非耸动标题。