英伟达推出 AI 框架 Polar,让 Codex 跑分暴涨 594.74%

Codex性能暴增:每百万Token成本降至原来的三十五分之一

4月27日,据英伟达官方消息,OpenAI的代理式编码应用Codex已全面升级,由最新的前沿模型GPT-5.5驱动,并运行在NVIDIA Grace Blackwell机架级扩展系统上。超过1万名英伟达员工(涵盖工程、产品、法律、营销、财务等部门)正在使用该应用,并评价其效果“令人惊叹”“足以改变生活”。与上一代系统相比,Codex在Grace Blackwell上的每百万Token成本降至原来的三十五分之一,每兆瓦每秒的Token吞吐量提升了50倍。这种巨大的经济效益使得前沿模型推理在企业级规模上的应用成为现实,直接催生了AI编码生产力的剧变。

SSD变身“推理记忆池”:存储架构被重写

英伟达在CES上发布的BlueField-4数据处理器及“推理上下文记忆存储平台”,将SSD从“后台容量”升级为“前沿性能关键部件”。随着大模型推理迈向长上下文、多轮交互和多智能体协作,KV Cache(键值缓存)已无法长期依赖GPU显存存放,否则会限制推理效率并推高成本。英伟达提出以BlueField-4为核心,将KV Cache等高频数据交由AI原生存储体系统一管理,并在集群中高速共享。这一架构使SSD承担起“外接显存”“推理记忆池”的角色,直接参与Tokens/s、首Token延迟和能效比的提升。市场反应迅速,希捷一夜暴涨88.5亿美元,四家存储公司合计暴涨约660亿美元,存储产业链的逻辑被彻底重估。

英伟达推出 AI 框架 Polar,让 Codex 跑分暴涨 594.74%

Orchestrator:8亿参数“小模型”智能调度大工具

英伟达与香港大学联合发布了Orchestrator模型,仅8亿参数,却能通过ToolOrchestra强化学习框架协调多种工具和大型语言模型。在博士级问题基准HLE上,Orchestrator以远低于大型模型的成本实现更高准确性,能够智能分解复杂任务,按需调用适当工具,减少高成本模型的调用频次。这种“小协调者+大工具”的复合系统,为企业提供了更经济、灵活的AI解决方案,尤其适用于依赖多种AI模型的多工具协同场景,展现了轻量级模型在推理调度中的巨大潜力。

Vera Rubin芯片出世:算力暴涨5倍,物理AI觉醒

2026年CES上,英伟达发布全新Vera Rubin平台,架构由1个Vera CPU + 2个Rubin GPU组成,推理性能相比上一代Grace Blackwell暴涨5倍,训练性能提升3.5倍,并采用100%全液冷、NVLink 6(400G SerDes)和硅光技术。配合Spectrum-X交换机和BlueField-4 DPU,Vera Rubin让算力成本断崖式下跌。老黄同时推出物理AI模型Alpamayo,能解释自己的驾驶决策(如“减速因为预测行人会横穿马路”),以及世界模拟器Cosmos,使AI从屏幕走向现实,自动驾驶、人形机器人等应用共享同一套训练逻辑。

从“训练为王”到“推理为王”:算力体系的重心转移

上述所有动作共同指向一个趋势:AI产业正在从以训练为中心转向以推理为中心。Codex的成本暴跌、SSD的推理层化、Orchestrator的调度优化、Vera Rubin的算力跃升,都旨在解决推理阶段的成本、延迟与吞吐瓶颈。英伟达通过架构级创新,将存储、计算、调度融为一体,使推理效率成为AI落地的核心竞争力。这意味着未来企业级AI应用将更依赖高性能推理基础设施,而非单纯堆叠训练算力。