刚刚，黄仁勋宣布 Rubin 全面投产，4万名工程师参与构建，史上最强CPU同步亮相

1 个月前

AI资讯

32 阅读

AI 英伟达芯片 Rubin

Vera Rubin全面投产，六款核心芯片齐发

在CES 2026主题演讲中，黄仁勋正式宣告Vera Rubin平台已进入全面生产阶段。这个由七款突破性芯片、五个机架和一台巨型超级计算机组成的系统，是英伟达有史以来最庞大的芯片工程。Rubin GPU被黄仁勋形容为“一只巨大的怪兽”，每个NVL72机架重达近2吨，包含220万亿个晶体管、18个计算托盘和9个NVLink交换机托盘。微软下一代AI超级工厂已确认将部署数十万颗Vera Rubin芯片，而整个平台由超过150家台湾供应链厂商共同打造，黄仁勋强调要将台湾AI超级电脑的制造量能翻倍。

4万名工程师极端协同设计，突破物理极限

面对晶体管数量仅增长1.6倍的物理瓶颈，英伟达通过“极端协同设计”强行实现了性能飞跃。自设计开始以来，累计投入了15,000个工程师年的工作量，实际参与构建的工程师总数超过4万人。这种协同设计从芯片、互联、机柜到数据中心全栈重构：通过NVLink 6互联以及BlueField-4驱动的推理上下文内存存储平台，每个GPU可额外获得16 TB的上下文内存。最终，Vera Rubin平台在AI推理性能上实现5倍提升，训练性能提升3.5倍，同时将Token生成成本压低至1/10。黄仁勋直言：“AI的推理成本每年要下降10倍，而AI‘思考’产生的token数量每年增长5倍。”

Vera CPU同步亮相：效率翻倍，速度飙升50%

与Rubin平台一同登场的还有全新的Vera CPU。这款处理器是传统机架式CPU效率的两倍，性能速度提升50%。Vera CPU的推出标志着英伟达在通用计算领域的野心——它不再仅仅依赖GPU加速，而是通过自研CPU重构整个计算节点。每个Vera Rubin节点包含144个Rubin GPU，搭配Vera CPU作为管理平面，配合Spectrum-X交换机实现全架构200 Gbps的并行数据速率。黄仁勋展示的实机模型显示，每台AI超级电脑内部有130万个零组件，包含液冷系统和长达8公里的铜线，是“世界上最重且最昂贵的电脑”。

从生成式AI到推理型AI，直击“算不起、记不住”痛点

黄仁勋在演讲中正式确立了AI范式的转移：从一次性的生成式问答转向多步推理和规划。他强调，AI已进入“会思考”的下半场，预训练、后训练和测试时扩展的计算量已爆炸式增长。Vera Rubin平台正是为解决这一根本挑战而生——通过庞大的上下文内存池（每个节点高达16 TB），破解智能体“显存墙”的瓶颈，使AI能够处理从未见过的复杂长尾场景。英伟达同时开源了Alpamayo自动驾驶推理模型、Cosmos物理世界模型和Nemotron智能体模型，推动AI具备逻辑推理能力和长时记忆能力。

物理AI的ChatGPT时刻已近，与西门子重塑工业

“物理AI的ChatGPT时刻已近”——黄仁勋高呼，并展示了从芯片到机器人的全栈拼图。英伟达与西门子达成深度合作，将CUDA-X库、AI模型和Omniverse集成到西门子的EDA、CAE和数字孪生工具中。“近两个世纪以来，西门子建立了世界的工业，现在它正在为AI时代重塑工业。”黄仁勋还列举了Palantir、ServiceNow、Snowflake等企业级合作伙伴，强调AI正在从数据中心走向物理世界。他总结道：“我们正站在新工业革命的开端——物理AI时代。”