英伟达 CEO 黄仁勋:Vera CPU 将比 GPU 更受欢迎,开辟 AI 智能体新市场
智能体AI引爆新一轮算力饥渴,CPU重回舞台中央
随着AI从单次推理迈向智能体阶段,每个智能体都需要调用工具、浏览器和进行编排调度,单纯依赖GPU已无法满足需求。英伟达CEO黄仁勋指出,自ChatGPT问世以来,AI已先后经历推理增强和智能体化演进,未来将有数十亿个AI智能体同时运行,每个智能体都需要自己的“AI PC”来完成工具调用和编排任务。这种工作负载的剧变,使得CPU的重要性急剧回升——数据中心内CPU与GPU的比例正从传统的1:8迅速向1:1甚至更高演进。英伟达管理层在电话会上强调,智能体AI正驱动下一波算力基础设施建设狂潮,并将2030年末年度AI行业整体开支规模预测上调至3万亿至4万亿美元。
专为Agent量身定制的“思考引擎”:Vera CPU性能碾压x86
Vera CPU是英伟达首款专为AI智能体设计的处理器,基于自研的Olympus核心架构,核心数从上一代Grace的72个提升至88个。在Agent相关工作负载测试中,Vera的任务执行速度达到同期x86服务器CPU的1.8倍。相比单纯的性能提升,其真正的杀手锏在于与Rubin GPU通过第二代NVLink-C2C直连,实现高达1.8TB/s的互联带宽。这极大降低了智能体运行过程中CPU与GPU之间的数据搬运开销,使GPU在Agent任务链路中的利用率得以显著提高。黄仁勋形象地比喻:“今天的CPU是为人类设计的,而Vera是为AI智能体打造的。”首批Vera CPU已交付Anthropic、OpenAI及SpaceX xAI等前沿实验室。

Vera Rubin平台性能狂飙35倍,有望成为史上最成功产品
与Vera CPU搭档的是新一代Rubin GPU,两者共同构成Vera Rubin机架级系统。通过集成七个专用芯片,Vera Rubin的推理吞吐量最高可达Blackwell的35倍,AI工厂营收效率提升10倍,单token成本降至十分之一。英伟达CFO Colette Kress表示,Vera Rubin将于今年下半年(Q3开始)量产出货,目前几乎所有主要客户都已下达采购订单,需求已呈抛物线式增长。黄仁勋在电话会上直言:“Vera Rubin甚至会比Grace Blackwell更成功。现在几乎想不到有哪家前沿模型公司不会从一开始就迁移到Vera Rubin”,而Blackwell推出时并非如此。
从GPU到CPU:英伟达战略转型,解锁2000亿美元全新市场
英伟达首次将CPU业务作为未来核心增长引擎推向台前。公司预计今年CPU营收将接近200亿美元,并宣称将借此成为全球领先的CPU供应商。更重要的是,黄仁勋指出,这并非简单侵蚀传统CPU市场,而是由智能体AI驱动的全新增量市场——总市场规模高达2000亿美元。每个智能体都需要自己的CPU来执行编排、工具调用和记忆管理,而Vera是唯一能够提供CPU+GPU端到端AI全栈架构的解决方案。这一战略转型意味着英伟达正从一家GPU公司,彻底转向涵盖CPU、GPU、网络、软件的AI基础设施全栈垄断者,其市场话语权进一步扩大。
黄仁勋的“Agent工厂”全景:从芯片到机器人,全栈包围未来
在COMPUTEX 2026上,黄仁勋将叙事重心从芯片转向了AI智能体,描绘了完整的“Agent工厂”蓝图。除了Vera CPU和Rubin GPU,英伟达还发布了Cosmos 3世界基础模型、Nemotron NemoClaw智能体编排框架、面向企业桌面的DGX Station for Windows,以及联合宇树发布首款基于Isaac GR00T的人形机器人参考设计H2 Plus。同时推出的DSX(数据中心即服务)平台,将AI工厂的设计、仿真、建设、运营、安全全链条标准化。黄仁勋断言:“Agent AI和实用型人工智能时代已经到来,token是利润单位,AI是GDP生成器。” 这一系列布局表明,英伟达正围绕智能体重构从芯片到机器人的完整技术体系,AI基础设施扩张被视为“人类历史上最大规模的基础设施扩张”。