5分钟缓存清零，性能打1折，集体声讨Claude，CC之父紧急回应

1 个月前

AI资讯

17 阅读

Claude模型开发者社区][prompt缓存性能问题

随着大模型应用的不断深入，prompt缓存（Prompt Cache）技术被视为提升推理效率、降低计算成本的重要手段。Anthropic旗下的Claude系列模型近期推出了缓存优化功能，理论上可将缓存有效时间（TTL）延长至1小时，从而提升模型在连续对话或重复提示场景下的响应速度和资源利用率。

然而，近期开发者社区中传出一条令人震惊的消息：在特定配置下，Claude Code的prompt缓存TTL被强制缩短至5分钟，性能损失高达90%。这一问题迅速引发了广泛讨论，并波及到开发者对Anthropic的信任。

开发者在测试中发现，使用环境变量 DISABLE_TELEMETRY=1 后，Claude Code 的 prompt cache TTL 从原本的1小时骤降至5分钟。
据称，这一机制可能是Anthropic为了防止用户规避模型调用记录而设置的反制措施，但并未在官方文档中明确说明。
缓存时间缩短意味着模型在重复任务中需要频繁重新解析提示内容，从而导致响应延迟显著增加，推理成本也大幅提升。

5分钟缓存清零，性能打1折，集体声讨Claude，CC之父紧急回应

这一发现迅速在技术社区传播开来，尤其在需要高频调用模型的开发团队中引发了强烈不满。

声讨的焦点逐渐集中在Anthropic是否在用户不知情的情况下对模型进行降级处理，甚至有人将其与OpenAI等厂商的API限制政策类比，认为这是一场“厂商控制权”与“用户自由权”的较量。

面对舆论压力，Anthropic联合创始人兼首席科学家 Dario Amodei（常被称为“CC之父”）迅速作出回应，主要观点包括：

此外，Amodei呼吁开发者理解公司立场，并表示愿意与社区进一步沟通，以达成性能与隐私之间的平衡。

目前，该事件已对Anthropic的开发者关系造成一定冲击，具体影响包括：

尽管Anthropic已作出初步回应，但开发者社区仍在等待更具体的补救措施和政策调整。此次事件也再次提醒了AI生态中“开放性”与“控制权”之间的微妙平衡问题。