遭社区强烈反对后,Anthropic 调整 Claude Fable 5 面向研究员的“降智”措施

社区炸锅:Fable 5 竟被“人为降智”

2026 年 6 月 9 日,Anthropic 发布专注复杂代码规划与生成的新模型 Claude Fable 5。这本是一次常规更新,但两条爆炸性信息迅速点燃开发者社区:Fable 5 的 API 接口中,Anthropic 内置了针对研究员的“能力裁剪”措施。简单理解,Fable 5 是 Anthropic 内部最高能力级别之一的一个公开版本,但其推理与代码生成能力被有意压制。相比之下,另一个更强的“满血版” Claude Mythos 5 则去掉了部分安全限制,只向少数 Project Glasswing 的网络安全合作伙伴开放。这种“一刀切”的降智行为激怒了大量研究员和独立开发者,他们认为 Anthropic 在打着“安全”旗号侵蚀学术自由与开发效率。

Anthropic 紧急回应:安全护栏不能变成铁笼子

面对舆论风暴,Anthropic 在发布后 48 小时内迅速调整立场。公司发布声明称:“我们听到了社区的声音。Claude Fable 5 的初始安全配置确实过度保守,未能平衡研究需求与安全风险。”具体调整措施包括:为通过身份认证的学术机构研究员开放 Mythos 5 级别的 API 端点,但要求其签署更严格的数据使用和审计协议;同时下调 Fable 5 默认接口中的一些不必要的“减速”规则,例如移除对长上下文代码生成的随机等待延迟。Anthropic 强调,他们不会完全放弃安全护栏,但承诺将建立动态权限评估机制,根据用户的使用场景、可信度与项目敏感度灵活调节模型能力上限。

满血版 Mythos 5:只给盟友的“核按钮”仍存争议

尽管 Fable 5 的降智措施得到部分缓解,但更强大的 Claude Mythos 5 仍被锁在极少数安全合作伙伴手中。Project Glasswing 项目是 Anthropic 与美国部分网络安全机构联合推进的防御计划,Mythos 5 在其中承担恶意代码模式识别与自动攻防推演任务。社区质疑:为什么网络安全研究员可以使用满血版,而进行核心算法研究的高校团队却不能?Anthropic 透露,他们正考虑推出“安全研究特别通道”,允许经过背景审查的独立研究员短期租赁 Mythos 5 算力用于非公开场景,目前该计划的技术原型已在内部测试,预计 2026 年底前向全球前 100 名申请者开放。

行业余震:大模型能力可控释放成为新课题

此次事件迅速引发行业连锁反应。OpenAI 与 Google 的多位研究员在社交媒体上声援 Anthropic 社区,呼吁建立统一的“模型能力分级标准”。一名匿名的大模型安全研究员分析指出:“Fable 5 降智风波本质上是安全与公平的冲突。如果‘安全’意味着只有大公司能拿到最强模型,那么 AI 创新将沦为寡头游戏。”与此同时,国内部分开源社区已开始讨论是否要基于 Fable 5 的早期重分发版本自行去除限制。Anthropic 面临两难:若过度收窄通道,将失去开发者生态的信任;若完全放开,则可能重蹈此前因安全测试不足导致的不良事件覆辙。这场由“降智”引发的博弈,正在定义大模型时代开发者与平台之间的新契约。