刚刚,黄仁勋宣布 Rubin 全面投产,4万名工程师参与构建,史上最强CPU同步亮相
Vera Rubin全面投产,六款核心芯片齐发
在CES 2026主题演讲中,黄仁勋正式宣告Vera Rubin平台已进入全面生产阶段。这个由七款突破性芯片、五个机架和一台巨型超级计算机组成的系统,是英伟达有史以来最庞大的芯片工程。Rubin GPU被黄仁勋形容为“一只巨大的怪兽”,每个NVL72机架重达近2吨,包含220万亿个晶体管、18个计算托盘和9个NVLink交换机托盘。微软下一代AI超级工厂已确认将部署数十万颗Vera Rubin芯片,而整个平台由超过150家台湾供应链厂商共同打造,黄仁勋强调要将台湾AI超级电脑的制造量能翻倍。
4万名工程师极端协同设计,突破物理极限
面对晶体管数量仅增长1.6倍的物理瓶颈,英伟达通过“极端协同设计”强行实现了性能飞跃。自设计开始以来,累计投入了15,000个工程师年的工作量,实际参与构建的工程师总数超过4万人。这种协同设计从芯片、互联、机柜到数据中心全栈重构:通过NVLink 6互联以及BlueField-4驱动的推理上下文内存存储平台,每个GPU可额外获得16 TB的上下文内存。最终,Vera Rubin平台在AI推理性能上实现5倍提升,训练性能提升3.5倍,同时将Token生成成本压低至1/10。黄仁勋直言:“AI的推理成本每年要下降10倍,而AI‘思考’产生的token数量每年增长5倍。”
Vera CPU同步亮相:效率翻倍,速度飙升50%
与Rubin平台一同登场的还有全新的Vera CPU。这款处理器是传统机架式CPU效率的两倍,性能速度提升50%。Vera CPU的推出标志着英伟达在通用计算领域的野心——它不再仅仅依赖GPU加速,而是通过自研CPU重构整个计算节点。每个Vera Rubin节点包含144个Rubin GPU,搭配Vera CPU作为管理平面,配合Spectrum-X交换机实现全架构200 Gbps的并行数据速率。黄仁勋展示的实机模型显示,每台AI超级电脑内部有130万个零组件,包含液冷系统和长达8公里的铜线,是“世界上最重且最昂贵的电脑”。
从生成式AI到推理型AI,直击“算不起、记不住”痛点
黄仁勋在演讲中正式确立了AI范式的转移:从一次性的生成式问答转向多步推理和规划。他强调,AI已进入“会思考”的下半场,预训练、后训练和测试时扩展的计算量已爆炸式增长。Vera Rubin平台正是为解决这一根本挑战而生——通过庞大的上下文内存池(每个节点高达16 TB),破解智能体“显存墙”的瓶颈,使AI能够处理从未见过的复杂长尾场景。英伟达同时开源了Alpamayo自动驾驶推理模型、Cosmos物理世界模型和Nemotron智能体模型,推动AI具备逻辑推理能力和长时记忆能力。
物理AI的ChatGPT时刻已近,与西门子重塑工业
“物理AI的ChatGPT时刻已近”——黄仁勋高呼,并展示了从芯片到机器人的全栈拼图。英伟达与西门子达成深度合作,将CUDA-X库、AI模型和Omniverse集成到西门子的EDA、CAE和数字孪生工具中。“近两个世纪以来,西门子建立了世界的工业,现在它正在为AI时代重塑工业。”黄仁勋还列举了Palantir、ServiceNow、Snowflake等企业级合作伙伴,强调AI正在从数据中心走向物理世界。他总结道:“我们正站在新工业革命的开端——物理AI时代。”