黄仁勋对未来十年的完整判断, 今天都讲明白了

12 小时前
13 阅读

重新定义AI PC:从点击工具到私人助理

黄仁勋与微软联手推出的RTX Spark,是一台搭载联发科合作芯片N1X的AI PC。它内置20核Grace CPU和Blackwell RTX GPU,拥有128GB统一内存和700亿晶体管,彻底改变了个人电脑的定义。

这台电脑的核心突破是能在本地运行AI Agent。过去需要连到云端的AI助手,如今可以直接在你的笔记本上操作各类软件。黄仁勋现场演示了一个Agent如何在本地设计房子:它先读取概念草图与需求,然后自动打开Rhino建模、优化成本与结构,再导入Blender渲染,全程无需用户手动点击任何软件。他总结道:“过去40年你用电脑是启动应用、点击、输入;现在你只需要问,电脑就会帮你完成工作。”

为了实现这一目标,微软特意提高了GPU可访问的系统内存上限,让本地能运行高达1200亿参数的大模型。英伟达还推出了OpenShell安全层,允许用户限制Agent权限,并根据隐私策略智能地将查询路由到本地或云端。ASUS、Dell、HP、联想等品牌将于2025年秋季推出相关超薄笔记本。

算力需求的三重引擎:为什么黄仁勋说“我低估了它”

黄仁勋坦诚,自己一年前关于“推理算力将增长十亿倍”的预言实际上“低估了”。他系统阐述了驱动AI发展的三大扩展定律的叠加效应:

第一台发动机:预训练。AI像学生“吞下”整个互联网信息,学会语言和知识基础。这仍是“大力出奇迹”的阶段。

第二台发动机:后训练。预训练毕业的AI需要针对性强化技能,例如反复练习“写代码”、“做设计”等具体任务,直到找到最优解。这一步极其消耗算力。

第三台发动机:推理。这是最大变量。AI不再是从记忆里直接掏答案,而是像“专家开会”一样先“查资料”、“核实信息”、“琢磨逻辑”,思考得越久,答案质量越高。

这三台发动机不是轮流上岗,而是同时加速。每个人用AI消耗的算力越来越大,同时使用AI的人越来越多,两者相乘,导致了“双重指数级”的算力需求爆炸。这也解释了为何OpenAI要砸上千亿建“星际之门”算力设施。

Vera Rubin:为Agent时代打造的AI工厂

黄仁勋指出,Agent时代需要的新型计算架构。Agent不止生成答案,它要观察、推理、规划、用工具、管理大量上下文和记忆。为此,英伟达设计了全新的Vera Rubin平台,由七颗新芯片组成,采用台积电3nm工艺和CoWoS-L封装。

Vera Rubin AI工厂由五种机架组成:NVL72负责“大脑”的推理与规划,Vera CPU机架协调模型与内存,Groq 3 LPX机架提供超低延迟Token生成,BlueField-4存储机架充当Agent的“记忆”,Spectrum-X以太网机架则通过共封装光学技术连接百万GPU。最大的变革在于组装效率:以前组装一个Grace Blackwell机架需要两小时,现在Vera Rubin只需五分钟——因为设计完全模块化、液冷,通过PCB中板直接连接,取消了线缆和软管。

同时,英伟达推出了DSX(数据中心基础设施平台),为AI工厂提供从设计仿真到运营优化的完整蓝图。DSX Max-Q技术尤为关键:它能通过动态电力分配和在45摄氏度下运行温液冷却,让运营商在相同电力预算下部署更多GPU。黄仁勋强调,计算就是收入,如果架构不灵活,资产寿命就会变短。而英伟达CUDA生态的资产寿命更长,“因为全球软件开发者都在用”,这直接降低了总拥有成本。

主权AI:每个国家都需要自己的AI基础设施

黄仁勋认为,AI已经上升到国家经济和安全的战略高度。未来十年,每个国家都会像建设电网、通信网一样,建设自己的AI基础设施,把本国的文化、历史和数据规则“装”进AI里。

他观察到一个关键趋势:全球会掀起一轮国家级AI基建潮,从欧洲到中东,从东南亚到拉美,各国都要抢着建自己的“AI工厂”。这为英伟达打开了万亿级的新市场。同时,他提醒不要低估中国企业的创新能力,“中国有全世界最牛的企业家和工程师”。美国若搞脱钩,等于把市场让给中国本土企业。

AI同事上岗:你准备好了吗?

黄仁勋断言,通用计算时代已经结束。未来十年,每个人都会拥有一个“AI同事”。英伟达内部已经实现了100%覆盖——每个软件工程师和芯片设计师都与AI一起工作,结果芯片设计得更好、更快。

对个人而言,核心竞争力将变成“提出好问题”、“批判性判断”和“创造力”。黄仁勋在演讲最后强调:“My heart is in the future. 未来执行会越来越廉价,但真正昂贵的,会变成:判断力、创造力、审美、方向感和对复杂世界的理解能力。” 对企业而言,比拼的不再是员工数量,而是能否用AI将员工效率翻倍。算力成为“新电力”,扛得起多少电费,就相当于能“造”出多少智能。