遭社区强烈反对后，Anthropic 调整 Claude Fable 5 面向研究员的“降智”措施

1 个月前

AI资讯

65 阅读

claude [Anthropic 降智 5 Fable 社区反对]

社区炸锅：Fable 5 竟被“人为降智”

2026 年 6 月 9 日，Anthropic 发布专注复杂代码规划与生成的新模型 Claude Fable 5。这本是一次常规更新，但两条爆炸性信息迅速点燃开发者社区：Fable 5 的 API 接口中，Anthropic 内置了针对研究员的“能力裁剪”措施。简单理解，Fable 5 是 Anthropic 内部最高能力级别之一的一个公开版本，但其推理与代码生成能力被有意压制。相比之下，另一个更强的“满血版” Claude Mythos 5 则去掉了部分安全限制，只向少数 Project Glasswing 的网络安全合作伙伴开放。这种“一刀切”的降智行为激怒了大量研究员和独立开发者，他们认为 Anthropic 在打着“安全”旗号侵蚀学术自由与开发效率。

Anthropic 紧急回应：安全护栏不能变成铁笼子

面对舆论风暴，Anthropic 在发布后 48 小时内迅速调整立场。公司发布声明称：“我们听到了社区的声音。Claude Fable 5 的初始安全配置确实过度保守，未能平衡研究需求与安全风险。”具体调整措施包括：为通过身份认证的学术机构研究员开放 Mythos 5 级别的 API 端点，但要求其签署更严格的数据使用和审计协议；同时下调 Fable 5 默认接口中的一些不必要的“减速”规则，例如移除对长上下文代码生成的随机等待延迟。Anthropic 强调，他们不会完全放弃安全护栏，但承诺将建立动态权限评估机制，根据用户的使用场景、可信度与项目敏感度灵活调节模型能力上限。

满血版 Mythos 5：只给盟友的“核按钮”仍存争议

尽管 Fable 5 的降智措施得到部分缓解，但更强大的 Claude Mythos 5 仍被锁在极少数安全合作伙伴手中。Project Glasswing 项目是 Anthropic 与美国部分网络安全机构联合推进的防御计划，Mythos 5 在其中承担恶意代码模式识别与自动攻防推演任务。社区质疑：为什么网络安全研究员可以使用满血版，而进行核心算法研究的高校团队却不能？Anthropic 透露，他们正考虑推出“安全研究特别通道”，允许经过背景审查的独立研究员短期租赁 Mythos 5 算力用于非公开场景，目前该计划的技术原型已在内部测试，预计 2026 年底前向全球前 100 名申请者开放。

行业余震：大模型能力可控释放成为新课题

此次事件迅速引发行业连锁反应。OpenAI 与 Google 的多位研究员在社交媒体上声援 Anthropic 社区，呼吁建立统一的“模型能力分级标准”。一名匿名的大模型安全研究员分析指出：“Fable 5 降智风波本质上是安全与公平的冲突。如果‘安全’意味着只有大公司能拿到最强模型，那么 AI 创新将沦为寡头游戏。”与此同时，国内部分开源社区已开始讨论是否要基于 Fable 5 的早期重分发版本自行去除限制。Anthropic 面临两难：若过度收窄通道，将失去开发者生态的信任；若完全放开，则可能重蹈此前因安全测试不足导致的不良事件覆辙。这场由“降智”引发的博弈，正在定义大模型时代开发者与平台之间的新契约。

遭社区强烈反对后，Anthropic 调整 Claude Fable 5 面向研究员的“降智”措施

社区炸锅：Fable 5 竟被“人为降智”

Anthropic 紧急回应：安全护栏不能变成铁笼子

满血版 Mythos 5：只给盟友的“核按钮”仍存争议

行业余震：大模型能力可控释放成为新课题

链接失效反馈