英伟达 GTC 2026:智能体 AI 时代,全栈战略正式落地 |附演讲全文

万亿美元需求与Token工厂经济学:AI基础设施的新商业逻辑

黄仁勋在演讲中揭示了一个关键转折:AI需求正从训练全面转向推理。他预测,到2027年,市场至少有1万亿美元的需求,远超一年前对2026年5000亿美元的预估。这一判断建立在“Token工厂”的全新商业思维之上——未来的数据中心不再是存储仓库,而是生产AI基本单位“Token”的工厂。黄仁勋强调:“你的吞吐量和Token产生速度,将直接转换为明年的精确收入。”他还提出,硅谷企业已开始将“年薪+Token预算”作为招募筹码,每位工程师都将配备年度Token额度以实现10倍效率提升。这一逻辑解释了为何英伟达系统能成为全球成本最低的AI基础设施:通用性使其能运行几乎所有领域的AI模型,客户投资可被充分复用并维持长生命周期。

Vera Rubin+Groq:推理性能35倍飙升,全栈硬件重构

英伟达发布了专为智能体AI设计的Vera Rubin系统。该系统由Vera CPU、Rubin GPU、NVLink 72及全新Groq LPU(语言处理单元)组成,实现了3.6 exaflops算力与260 TB/s的all-to-all NVLink带宽。黄仁勋指出,Vera Rubin在同一座1GW数据中心内创造了惊人的性能跨越:相对于Blackwell,Vera Rubin带来5倍收入提升。而针对Token生成中GPU在高吞吐低延迟区间的乏力,英伟达收购并集成了Groq的推理技术,推出Groq LP30芯片(由三星代工,下半年出货)。通过Dynamo软件捏合,Vera Rubin+Groq的组合在高层推理层级实现性能飙涨35倍,每兆瓦吞吐量同样提升35倍。黄仁勋建议:100%工作负载使用Vera Rubin即可满足高吞吐需求;若涉及大量高价值工程类Token生成,可将数据中心的25%资源加入Groq。此外,七款Vera Rubin芯片已进入全面量产,首个机架已在微软Azure上运行。

英伟达 GTC 2026:智能体 AI 时代,全栈战略正式落地 |附演讲全文

OpenClaw:智能体AI的“操作系统”,开启个人Agent革命

黄仁勋将OpenClaw称为“人类历史上最受欢迎的开源项目”,并类比其意义如Windows开启了个人电脑时代。OpenClaw本质上是开源了Agent计算机的操作系统,使得每个人都能创建自己的个人Agent。黄仁勋表示:“现在,我们每个人都能创建自己的个人Agent,这种影响是不可思议的。”他还强调,世界上每一家企业、每一家软件公司都需要一个智能体系统,需要一个OpenClaw战略。英伟达为此推出了NemoClaw参考设计、Agentic AI Toolkit,并联合Black Forest Labs、Cursor、LangChain、Mistral、Perplexity等公司组成Nemotron联盟,投资数十亿美元用于AI基础设施,以激活全球各行各业。这一举措将企业IT从2万亿美元产业推向数万亿美元,催生专属于特定领域的可租用智能体。

从芯片到AI工厂:英伟达全栈平台覆盖五层架构

黄仁勋明确指出,英伟达已完成从芯片企业到AI全栈基础设施搭建者的转型。GTC覆盖了AI五层架构的每一层:从土地、电力、机房,到基础设施、芯片、平台、模型,再到最终的应用。硬件层面,除了Vera Rubin,还有全球首个采用共封装光学(CPO)的Spectrum-6 SPX交换机,带动PCB、CCL等产业链机会。Ruby Ultra(2027年推出)将搭载144个GPU,采用Kyber机架,实现更大规模纵向扩展。未来Feynman架构(2028年推出)将采用定制HBM。软件层面,英伟达加速了cuDF(结构化数据处理)和cuVS(非结构化数据处理),并集成到Google Cloud、Dell等平台。黄仁勋强调:“英伟达是一家算法公司”,通过持续优化算法降低计算成本、提升规模。DSX平台(数字孪生)则用于AI工厂设计和管理,将物理AI、机器人、自动驾驶等场景纳入统一体系。

物理AI与太空数据中心:英伟达的未来野心

在物理AI领域,黄仁勋认为“真实世界的数据永远不够,我们需要来自AI与仿真的数据。”英伟达持续推动Cosmos世界模型和Groot机器人模型,并宣布在自动驾驶和机器人领域的一系列合作。更具想象力的是,英伟达已通过Thor芯片的辐射认证,并计划推出Vera Rubin Space One计算机,用于太空数据中心。黄仁勋坦言:“在太空中没有传导和对流,只有辐射,我们必须弄清楚如何冷却这些系统。”这一探索标志着英伟达已将AI基础设施的边界扩展到地球之外,为未来的“物理AI”与“太空计算”铺平道路。