实测Claude史上最强模型Fable 5，普通人慎用

1 个月前

AI资讯

128 阅读

claude 编程 Sonnet 5 性能

中端定价，旗舰性能：Sonnet 5的越级硬刚

多名开发者在Google Vertex AI调用API时意外发现神秘模型ID claude-sonnet-5@20260203，随后被AI博主Pankaj Kumar确认——Claude Sonnet 5（Fennec）已部署在谷歌基础设施中。内部基准测试显示，其整体性能全面超越旗舰级Claude Opus 4.5，尤其是在SWE-Bench编程测试上得分突破80.9%，远超当前所有编程模型。更让竞品失眠的是，它的定价仅为Opus 4.5的50%。实现这一“中端干旗舰”奇迹的关键，是Anthropic绕开紧缺的H100，直接在谷歌TPU上训练优化，大幅降低推理成本。这意味着开发者可以用更低成本，获得此前只有高端模型才能完成的复杂任务——修Bug、重构、补测试、跑CI，Sonnet 5已经不只是“写代码”，而是在“交付代码”。

实测Claude史上最强模型Fable 5，普通人慎用

百万上下文窗口：把整个项目塞进去

Sonnet 5的上下文窗口扩展至100万tokens，配合更低的延迟和更快的运行速度，开发者可以直接将完整项目代码库当作输入。它不再是按文件逐一“看”，而是从全局理解架构后再动手修改。在Dev Team模式下，模型能自动生成多个子智能体并行协作，相当于一个人拥有了整个开发团队的外挂能力。对于需要频繁重构大型代码库的团队来说，这直接解决了Opus系列“太慢、太贵”的核心痛点。

蜂群模式曝光：AI会自己“生孩子”

真正让人细思极恐的是尚未公开的Claude Code蜂群（Swarm）功能。爆料人Mike Kelly在X上放出了一个名为Claude Sneak Peek的测试分支，揭示了这套层级式多智能体协作系统：总指挥→组长→执行者，任务间存在依赖关系，自动调度。实测中，让Claude读取一个plan.md后，它立即自动创建了Team Leader、Front-end Builder、Backend Builder、QA Tester等Agent，全部并行工作且状态实时可见。最夸张的是，执行过程中Agent会“自己生孩子”——因任务需要，又生成了PI Server Agent、CSS专项Agent等，Agent数量从初始4个膨胀到8个，全程无人干预。这已经不是多智能体，而是AI在自我组织。这种超级调度器能读取用户全部上下文，一旦开放，Claude Code将不再是写代码的工具，而是能自动组建研发团队的“母体”。这也是它迟迟未正式发布的原因：功能太危险，不能轻易放出来。对于普通用户来说，调用这个蜂群可能意味着失去对生成代码和系统行为的控制权，因此“普通人慎用”并非危言耸听。

实测Claude史上最强模型Fable 5，普通人慎用

中端定价，旗舰性能：Sonnet 5的越级硬刚

百万上下文窗口：把整个项目塞进去

蜂群模式曝光：AI会自己“生孩子”

链接失效反馈