联想集团董事长杨元庆:相信未来 GPU 服务器 70% 用于推理,30% 用于训练

训练到推理的转折点:杨元庆预判GPU算力分配新格局

联想集团董事长兼CEO杨元庆在财报业绩沟通会上明确指出,AI基础设施正经历从训练向推理的快速转移。他预判,未来GPU服务器市场将有70%用于推理,仅30%用于训练。这一判断基于当前AI应用的大规模落地——模型训练虽然仍在进行,但推理场景(如实时问答、图像生成、工业控制)的算力消耗正在呈指数级增长。杨元庆强调,这种结构性变化将推动服务器厂商从“拼算力峰值”转向“算力普惠与效率”。

联想集团董事长杨元庆:相信未来 GPU 服务器 70% 用于推理,30% 用于训练

联想与英伟达高层对话:推理时代CPU为何重新回到舞台中央

在1月3日联想集团公布的一段视频中,杨元庆与英伟达CEO黄仁勋罕见同框,共同探讨AI下一步演进。两人一致认为,推理任务对延迟和成本极为敏感,单纯依赖GPU集群反而低效,CPU因此重新回到市场讨论的中心。黄仁勋指出,推理场景中大量简单逻辑处理可由CPU完成,而GPU仅需处理重计算部分。这一观点与杨元庆的70/30预测形成呼应——未来服务器架构将更强调异构计算,而非“全GPU堆叠”。

定制化AI基础设施爆发:联想为微软等客户推出60多款服务器

随着AI服务商越来越多,联想正从“卖标准化服务器”转向“按需定制”。杨元庆在沟通会上透露,联想已为微软等战略合作伙伴提供多达60多款AI基础设施,覆盖高性能训练服务器、推理服务器以及边缘计算节点。这些产品满足不同客户对功耗、延迟和成本的组合要求——例如某款推理服务器专门针对大模型API调用优化,可将单次推理成本降低至训练阶段的1/20。杨元庆表示,这种定制化服务是联想在AI军备竞赛中突围的核心竞争力。

算力结构重构:推理需求如何重塑数据中心生态

AI基础设施的爆发式增长背后,是算力分配逻辑的根本转变。过去数据中心追求“训练标杆”(如千万亿次浮点运算),未来数据中心将更关注“推理吞吐量”(每秒处理查询数)。杨元庆在财报会上特别提到,推理已成为AI基础设施新增投入最密集的方向之一,这不仅影响服务器硬件设计,还倒逼云服务商、芯片厂商和软件栈联合优化。例如,英伟达已推出针对推理的专用GPU变体,而联想则开始提供预装推理框架的整机方案。这一趋势意味着:高价值数据中心将从“训练中心”进化为“推理工厂”,并催生新的商业模式——按查询次数而非算力用量计费。