OpenAI今晚放大招，奥特曼亲自上阵，GPT-5.6本周反杀

1 个月前

AI资讯

27 阅读

大模型 OpenAI 编程模型 GPT-5.6

编程王座两轮易主，Claude Opus 4.7刚登顶即被反杀

三个月内，编程大模型的王座经历了两轮激烈争夺。第一次，Anthropic的Claude Opus 4.7以硬核实力登顶，引发业界欢呼；第二次，OpenAI迅速祭出GPT-5.5，以77.48分重新夺回宝座。然而，好景不长，Claude Opus 4.7在后续评测中再度发力，将GPT-5.5的分数踩在脚下，差距达到3.5分。在这种焦灼战况下，OpenAI被迫加速迭代——GPT-5.6本周正式入场，目标直指“反杀”。

OpenAI今晚放大招，奥特曼亲自上阵，GPT-5.6本周反杀

奥特曼亲自上阵造势，Codex憋大招缓解焦虑

面对Gemini的红色警报和Claude Code的爆火，ChatGPT团队近期明显感到焦虑。OpenAI CEO山姆·奥特曼亲自下场，在社交平台发推预告“Codex将憋一个大招”，并宣布今晚将召开特别活动。这种由最高层直接站台的动作，在OpenAI历史上实属罕见，侧面反映出编程模型赛道的白热化竞争。奥特曼的亲自上阵不仅是为GPT-5.6造势，更是向市场传递“OpenAI依然掌控编程能力制高点”的信号。

GPT-5.6关键性能参数：领先Claude Opus 4.7约3.5分

据内部泄露与第三方测评数据，GPT-5.6在编程基准测试上的得分将显著超越Claude Opus 4.7。目前已知GPT-5.5的77.48分已被Claude反超，而GPT-5.6的目标是在同一评测体系下拉开3.5分以上的差距，重新确立绝对领先优势。该模型在代码生成、复杂算法推理和长上下文理解方面进行了针对性优化，据称能处理更复杂的工程级任务，包括自动修复bug、多文件重构等。

编程模型赛道军备竞赛：从月更新到周更新

OpenAI与Anthropic的编程模型竞争已进入“周更”节奏。从Claude Opus 4.7到GPT-5.5，再到GPT-5.6，每次迭代间隔不到一个月。这种高频率升级背后是双方对开发者生态的争夺——编程能力直接决定大模型在To B市场的商业价值。奥特曼今晚的“放大招”不仅是一次产品更新，更是一场战略宣言：OpenAI将不惜成本维持编程王座，而Anthropic的回应可能已在路上。

OpenAI今晚放大招，奥特曼亲自上阵，GPT-5.6本周反杀

编程王座两轮易主，Claude Opus 4.7刚登顶即被反杀

奥特曼亲自上阵造势，Codex憋大招缓解焦虑

GPT-5.6关键性能参数：领先Claude Opus 4.7约3.5分

编程模型赛道军备竞赛：从月更新到周更新

链接失效反馈