AI智能体成“内存吞噬兽”!黄仁勋:全链路产能见底,缺芯短时间内无解

智能体“思维链”引爆Token海啸,算力需求暴增百倍

黄仁勋在GTC主题演讲中明确指出,AI正从生成式迈向代理式(Agentic AI)时代。与简单生成文本不同,智能体需要自主观察、分解问题、尝试多种方案并验证结果,这一“思维链”过程产生的Token数量极其惊人。他举例说,传统一次性解决问题只需约400个Token,而一个智能体处理同一任务可能需要数十万Token,算力需求因此轻松增加100倍以上。

“去年我们预计的算力需求,现在看至少被低估了100倍。”黄仁勋强调,Token已成为AI公司的核心资产——每Token的生成都对应着计算成本与收入。这种“Token资产化”趋势,迫使云服务商和企业疯狂扩建数据中心,但所有环节的产能都已告急。

全链路产能见底:从GPU到存储、光互联无一幸免

黄仁勋直言,当前AI工厂的供给瓶颈早已不局限于GPU。他列出30余家产业链公司,点明从数据中心地皮、电力变压器、液冷散热,到CPU、HBM内存、光通信硅光芯片,全链路产能均已拉满。他特别指出,存储底座与光互连系统是当前最大瓶颈,这意味着即便拿到足够GPU,内存带宽和数据移动速度也可能拖垮整个系统。

AI智能体成“内存吞噬兽”!黄仁勋:全链路产能见底,缺芯短时间内无解

他在演讲中向供应链喊话:“英伟达需要更多的铜、光学器件和CPO,请所有供应商扩大产能!”同时,他警告“缺芯短时间内无解”——尽管英伟达已推出Vera Rubin、Rubin Ultra等年度迭代架构,但制造环节的晶圆产能、先进封装产能短期内无法骤增。他甚至将“迈威尔科技”称为下一个万亿美元公司,因为其光互连DSP技术正处于解决“连接瓶颈”的核心位置。

英伟达的“AI工厂”蓝图:从卖铲子到垄断建厂图纸

面对全链路产能危机,黄仁勋抛出了英伟达的终极解决方案——DSX全栈AI工厂平台。这套“建厂全家桶”不再仅出售GPU,而是提供包含Omniverse数字孪生、DSX OS操作系统、45℃热液冷却方案在内的整体设计图纸与物业管理。他解释,AI工厂必须从芯片、网络、存储到电力、冷却端到端协同设计,客户无法自行拼装。

“以前我们卖铲子,现在我们把整座矿场的设计图、施工调度和物业管理打包出售。”黄仁勋认为,当单体AI工厂建设造价迈向千亿美元,谁能帮助客户更快投产、更高效运转,谁就是时代赢家。他同期展示了NemoClaw智能体平台、开源Agent工具链,以及Nemotron联盟,意在将企业软件生态全面导向“代理平台化”,从而锁定更多Token生产需求。

端侧智能体异军突起:从云端算力到本地隐私安全

演讲中黄仁勋还强调了智能体在设备端的部署趋势。他宣布与微软重新定义PC,推出RTX Spark个人AI电脑,并强调“安全策略应在本地运行”。这与明略科技等企业的端侧AI战略不谋而合——其开源模型Mano-P可在M4 Pro上实现476 tokens/s预填充,峰值内存仅4.3GB,且所有数据无需上云。

黄仁勋指出,智能体正在渗透到企业乃至个人工作流,数据安全与隐私成为绕不开的前提。英伟达开源的Open Shell运行时支持“任何云端、本地甚至设备端”,这意味着端侧AI将从“能不能跑”进化为“跑得好、跑得省”。随着推理成本持续下降,智能体将不再仅是数据中心的“吞噬兽”,也将成为个人终端的“常驻助手”,但这也意味着全链路产能压力将进一步从云端蔓延至端侧芯片与内存制造。