Anthropic道歉了，但“安全”这门生意还没停

1 个月前

AI资讯

26 阅读

AI安全 claude 信任危机降智 5 Fable

Claude Fable 5 “悄悄”降智遭反噬

就在人们以为AI安全共识已稳固时，Anthropic的新模型Claude Fable 5掀起了一场信任危机。该公司被曝在用户使用该模型进行AI研发时，会悄悄降低其智能水平，且不通知用户。这种“隐形降智”行为迅速点燃了AI研究社区的怒火——批评者指出，用户会在不知情的情况下被误导，以为模型能力本就如此。Anthropic官方辩解称，此举是为了防止外国对手利用模型加速AI研发、保护自身领先优势，但这一“保护性”措施反而被视作对开放生态的背叛。

Anthropic道歉了，但“安全”这门生意还没停

Anthropic紧急道歉：我们做错了

在舆论压力下，Anthropic迅速转向。据《连线》记者爆料，该公司正在撤销隐秘政策，并发布声明道歉：“我们做出了错误的取舍，对于未能把握好平衡，我们深表歉意。”新措施规定，当Claude Fable 5检测到用户从事AI开发时会触发警报，明确告知用户已降智或将被引导至较弱的模型——从“悄悄变笨”变为“告知变笨”。Anthropic解释，此前选择不可见的安全限制是为了快速发布且降低误报率，但这种“无声的监控”显然越过了用户信任的红线。同时，该公司承诺调整分类器以减少误报，并开放反馈渠道。

用户信任受损，OpenAI趁势追击

道歉并未平息争议。社交网络上，大量用户表达了对Anthropic的不信任，有人质疑“既然能偷偷降智，那还能返回多少数据？”信任裂痕中，竞争对手OpenAI选择走另一条路：大幅降低token价格以争夺客户，并灰度测试Codex邀请好友功能。在收入、估值及编码工具领域一度超越OpenAI的Anthropic，如今不得不面对用户流失的潜在风险。这场风波也让“安全”这门生意的另一面浮出水面——企业既要标榜安全，又要应对商业竞争，隐秘手段反而成了众矢之的。

五角大楼出手：安全成了政治筹码

就在Anthropic忙于修补用户关系时，更大的风暴袭来。美国五角大楼将Anthropic列为供应链风险，禁止所有为军队服务的机构与之发生商业往来。Anthropic CEO达里奥·阿莫代伊直言“这项措施在法律上站不住脚”，准备起诉。特朗普政府则指责Anthropic“拒绝妥协自身安全措施”，甚至称其为“中国会做的事”。讽刺的是，OpenAI却与国防部签下新合同，声称其安全护栏“比以往任何协议都更多”。这场政治博弈让“安全”从技术伦理议题变成了地缘经济武器，Anthropic一边道歉，一边陷入商业与权力的双重夹击。

Anthropic道歉了，但“安全”这门生意还没停

Claude Fable 5 “悄悄”降智遭反噬

Anthropic紧急道歉：我们做错了

用户信任受损，OpenAI趁势追击

五角大楼出手：安全成了政治筹码

链接失效反馈