英伟达 Vera 处理器发布：专为 AI 智能体打造，OpenAI、SpaceXAI、字节跳动都要用

1 个月前

AI资讯

36 阅读

智能体 AI 英伟达 Vera

亲自送货上门：英伟达副总裁为马斯克开箱Vera

英伟达副总裁伊恩·巴克（Ian Buck）亲自驾驶货车，将首批Vera CPU系统挨个送达客户手中。第一站是Anthropic位于旧金山的办公室，其计算负责人詹姆斯·布拉德伯里接收了服务器；在OpenAI总部，巴克当场掏出螺丝刀，打开机箱盖展示内部结构；当天的终点是帕洛阿尔托的SpaceX AI办公室，埃隆·马斯克亲自签收，并当场详细询问核心数量、内存布局及散热方案。据透露，SpaceX AI计划将Vera用于强化学习工作负载与智能体仿真管线。

88颗Olympus核心，单核性能飙升50%

Vera搭载了英伟达自研的88颗Olympus核心，提供1.2 TB/s的内存带宽，单核性能相比前代Grace提升50%。它支持FP8精度，可直接承接AI推理与强化学习任务，无需GPU中转数据。英伟达强调，Vera不是追求核心数量最大化的传统CPU，而是专为高吞吐推理、工具调用及代码生成设计——当AI智能体需要同时处理规划任务、检索长上下文或调用API时，Vera能以极致的单线程性能和能效，确保昂贵的GPU不会因CPU处理速度慢而闲置。

英伟达 Vera 处理器发布：专为 AI 智能体打造，OpenAI、SpaceXAI、字节跳动都要用

专为“代理式AI”定制：从回答问题到主动行动

伊恩·巴克解释：“代理式AI正在AI工厂中催生一个全新的CPU时刻——模型从单纯的‘回答问题’转向主动‘采取行动’，Vera正是为了保障这种工作负载在大规模下高效运转而量身打造的。”与传统CPU不同，Vera的核心设计逻辑是针对代理沙箱、工具调用、编排层及长上下文检索等高频CPU操作进行深度优化，使AI智能体能够维持持续的高吞吐推理，而不是仅仅依赖GPU运行。

数十万颗部署计划：甲骨文云2026年大规模采用

甲骨文产品管理负责人卡兰·巴塔在接收现场透露：“甲骨文云基础设施（OCI）计划从2026年开始部署数十万颗英伟达Vera CPU。Agentic AI需要在大规模下维持持续性能，Vera的架构专为高吞吐推理设计，这正是我们为下一代企业AI提供动力所需的效率。”此外，Vera能够以传统基础设施两倍的能效服务AI企业，对大规模部署至关重要。

Vera+Rubin：英伟达全栈AI计算平台的基石

Vera不仅是独立的CPU产品，它还是即将发布的Vera Rubin超级芯片平台的主机处理器。通过第二代NVLink-C2C与两颗Rubin GPU配对，形成统一内存架构，协同完成AI工厂的异构计算。黄仁勋曾指出，当企业坐拥价值500亿美元的GPU时，绝不能让它们因为CPU处理速度慢而闲置。Vera与Rubin GPU、BlueField 4 DPU、Spectrum-X及MGX机架架构共同构成英伟达极致协同设计体系，推动英伟达从单一GPU厂商向全栈AI计算平台提供商转型。

英伟达 Vera 处理器发布：专为 AI 智能体打造，OpenAI、SpaceXAI、字节跳动都要用

亲自送货上门：英伟达副总裁为马斯克开箱Vera

88颗Olympus核心，单核性能飙升50%

专为“代理式AI”定制：从回答问题到主动行动

数十万颗部署计划：甲骨文云2026年大规模采用

Vera+Rubin：英伟达全栈AI计算平台的基石

链接失效反馈