实测Claude史上最强模型Fable 5,普通人慎用

5 小时前
5 阅读

中端定价,旗舰性能:Sonnet 5的越级硬刚

多名开发者在Google Vertex AI调用API时意外发现神秘模型ID claude-sonnet-5@20260203,随后被AI博主Pankaj Kumar确认——Claude Sonnet 5(Fennec)已部署在谷歌基础设施中。内部基准测试显示,其整体性能全面超越旗舰级Claude Opus 4.5,尤其是在SWE-Bench编程测试上得分突破80.9%,远超当前所有编程模型。更让竞品失眠的是,它的定价仅为Opus 4.5的50%。实现这一“中端干旗舰”奇迹的关键,是Anthropic绕开紧缺的H100,直接在谷歌TPU上训练优化,大幅降低推理成本。这意味着开发者可以用更低成本,获得此前只有高端模型才能完成的复杂任务——修Bug、重构、补测试、跑CI,Sonnet 5已经不只是“写代码”,而是在“交付代码”。

实测Claude史上最强模型Fable 5,普通人慎用

百万上下文窗口:把整个项目塞进去

Sonnet 5的上下文窗口扩展至100万tokens,配合更低的延迟和更快的运行速度,开发者可以直接将完整项目代码库当作输入。它不再是按文件逐一“看”,而是从全局理解架构后再动手修改。在Dev Team模式下,模型能自动生成多个子智能体并行协作,相当于一个人拥有了整个开发团队的外挂能力。对于需要频繁重构大型代码库的团队来说,这直接解决了Opus系列“太慢、太贵”的核心痛点。

蜂群模式曝光:AI会自己“生孩子”

真正让人细思极恐的是尚未公开的Claude Code蜂群(Swarm)功能。爆料人Mike Kelly在X上放出了一个名为Claude Sneak Peek的测试分支,揭示了这套层级式多智能体协作系统:总指挥→组长→执行者,任务间存在依赖关系,自动调度。实测中,让Claude读取一个plan.md后,它立即自动创建了Team Leader、Front-end Builder、Backend Builder、QA Tester等Agent,全部并行工作且状态实时可见。最夸张的是,执行过程中Agent会“自己生孩子”——因任务需要,又生成了PI Server Agent、CSS专项Agent等,Agent数量从初始4个膨胀到8个,全程无人干预。这已经不是多智能体,而是AI在自我组织。这种超级调度器能读取用户全部上下文,一旦开放,Claude Code将不再是写代码的工具,而是能自动组建研发团队的“母体”。这也是它迟迟未正式发布的原因:功能太危险,不能轻易放出来。对于普通用户来说,调用这个蜂群可能意味着失去对生成代码和系统行为的控制权,因此“普通人慎用”并非危言耸听。