英伟达 Vera 处理器发布:专为 AI 智能体打造,OpenAI、SpaceXAI、字节跳动都要用

18 小时前
4 阅读

亲自送货上门:英伟达副总裁为马斯克开箱Vera

英伟达副总裁伊恩·巴克(Ian Buck)亲自驾驶货车,将首批Vera CPU系统挨个送达客户手中。第一站是Anthropic位于旧金山的办公室,其计算负责人詹姆斯·布拉德伯里接收了服务器;在OpenAI总部,巴克当场掏出螺丝刀,打开机箱盖展示内部结构;当天的终点是帕洛阿尔托的SpaceX AI办公室,埃隆·马斯克亲自签收,并当场详细询问核心数量、内存布局及散热方案。据透露,SpaceX AI计划将Vera用于强化学习工作负载与智能体仿真管线。

88颗Olympus核心,单核性能飙升50%

Vera搭载了英伟达自研的88颗Olympus核心,提供1.2 TB/s的内存带宽,单核性能相比前代Grace提升50%。它支持FP8精度,可直接承接AI推理与强化学习任务,无需GPU中转数据。英伟达强调,Vera不是追求核心数量最大化的传统CPU,而是专为高吞吐推理、工具调用及代码生成设计——当AI智能体需要同时处理规划任务、检索长上下文或调用API时,Vera能以极致的单线程性能和能效,确保昂贵的GPU不会因CPU处理速度慢而闲置。

英伟达 Vera 处理器发布:专为 AI 智能体打造,OpenAI、SpaceXAI、字节跳动都要用

专为“代理式AI”定制:从回答问题到主动行动

伊恩·巴克解释:“代理式AI正在AI工厂中催生一个全新的CPU时刻——模型从单纯的‘回答问题’转向主动‘采取行动’,Vera正是为了保障这种工作负载在大规模下高效运转而量身打造的。”与传统CPU不同,Vera的核心设计逻辑是针对代理沙箱、工具调用、编排层及长上下文检索等高频CPU操作进行深度优化,使AI智能体能够维持持续的高吞吐推理,而不是仅仅依赖GPU运行。

数十万颗部署计划:甲骨文云2026年大规模采用

甲骨文产品管理负责人卡兰·巴塔在接收现场透露:“甲骨文云基础设施(OCI)计划从2026年开始部署数十万颗英伟达Vera CPU。Agentic AI需要在大规模下维持持续性能,Vera的架构专为高吞吐推理设计,这正是我们为下一代企业AI提供动力所需的效率。”此外,Vera能够以传统基础设施两倍的能效服务AI企业,对大规模部署至关重要。

Vera+Rubin:英伟达全栈AI计算平台的基石

Vera不仅是独立的CPU产品,它还是即将发布的Vera Rubin超级芯片平台的主机处理器。通过第二代NVLink-C2C与两颗Rubin GPU配对,形成统一内存架构,协同完成AI工厂的异构计算。黄仁勋曾指出,当企业坐拥价值500亿美元的GPU时,绝不能让它们因为CPU处理速度慢而闲置。Vera与Rubin GPU、BlueField 4 DPU、Spectrum-X及MGX机架架构共同构成英伟达极致协同设计体系,推动英伟达从单一GPU厂商向全栈AI计算平台提供商转型。