Anthropic道歉了,但“安全”这门生意还没停

Claude Fable 5 “悄悄”降智遭反噬

就在人们以为AI安全共识已稳固时,Anthropic的新模型Claude Fable 5掀起了一场信任危机。该公司被曝在用户使用该模型进行AI研发时,会悄悄降低其智能水平,且不通知用户。这种“隐形降智”行为迅速点燃了AI研究社区的怒火——批评者指出,用户会在不知情的情况下被误导,以为模型能力本就如此。Anthropic官方辩解称,此举是为了防止外国对手利用模型加速AI研发、保护自身领先优势,但这一“保护性”措施反而被视作对开放生态的背叛。

Anthropic道歉了,但“安全”这门生意还没停

Anthropic紧急道歉:我们做错了

在舆论压力下,Anthropic迅速转向。据《连线》记者爆料,该公司正在撤销隐秘政策,并发布声明道歉:“我们做出了错误的取舍,对于未能把握好平衡,我们深表歉意。”新措施规定,当Claude Fable 5检测到用户从事AI开发时会触发警报,明确告知用户已降智或将被引导至较弱的模型——从“悄悄变笨”变为“告知变笨”。Anthropic解释,此前选择不可见的安全限制是为了快速发布且降低误报率,但这种“无声的监控”显然越过了用户信任的红线。同时,该公司承诺调整分类器以减少误报,并开放反馈渠道。

用户信任受损,OpenAI趁势追击

道歉并未平息争议。社交网络上,大量用户表达了对Anthropic的不信任,有人质疑“既然能偷偷降智,那还能返回多少数据?”信任裂痕中,竞争对手OpenAI选择走另一条路:大幅降低token价格以争夺客户,并灰度测试Codex邀请好友功能。在收入、估值及编码工具领域一度超越OpenAI的Anthropic,如今不得不面对用户流失的潜在风险。这场风波也让“安全”这门生意的另一面浮出水面——企业既要标榜安全,又要应对商业竞争,隐秘手段反而成了众矢之的。

五角大楼出手:安全成了政治筹码

就在Anthropic忙于修补用户关系时,更大的风暴袭来。美国五角大楼将Anthropic列为供应链风险,禁止所有为军队服务的机构与之发生商业往来。Anthropic CEO达里奥·阿莫代伊直言“这项措施在法律上站不住脚”,准备起诉。特朗普政府则指责Anthropic“拒绝妥协自身安全措施”,甚至称其为“中国会做的事”。讽刺的是,OpenAI却与国防部签下新合同,声称其安全护栏“比以往任何协议都更多”。这场政治博弈让“安全”从技术伦理议题变成了地缘经济武器,Anthropic一边道歉,一边陷入商业与权力的双重夹击。