联想集团董事长杨元庆：相信未来 GPU 服务器 70% 用于推理，30% 用于训练

2 个月前

AI资讯

33 阅读

ai基础设施][GPU服务器推理训练算力分配

训练到推理的转折点：杨元庆预判GPU算力分配新格局

联想集团董事长兼CEO杨元庆在财报业绩沟通会上明确指出，AI基础设施正经历从训练向推理的快速转移。他预判，未来GPU服务器市场将有70%用于推理，仅30%用于训练。这一判断基于当前AI应用的大规模落地——模型训练虽然仍在进行，但推理场景（如实时问答、图像生成、工业控制）的算力消耗正在呈指数级增长。杨元庆强调，这种结构性变化将推动服务器厂商从“拼算力峰值”转向“算力普惠与效率”。

联想集团董事长杨元庆：相信未来 GPU 服务器 70% 用于推理，30% 用于训练

联想与英伟达高层对话：推理时代CPU为何重新回到舞台中央

在1月3日联想集团公布的一段视频中，杨元庆与英伟达CEO黄仁勋罕见同框，共同探讨AI下一步演进。两人一致认为，推理任务对延迟和成本极为敏感，单纯依赖GPU集群反而低效，CPU因此重新回到市场讨论的中心。黄仁勋指出，推理场景中大量简单逻辑处理可由CPU完成，而GPU仅需处理重计算部分。这一观点与杨元庆的70/30预测形成呼应——未来服务器架构将更强调异构计算，而非“全GPU堆叠”。

定制化AI基础设施爆发：联想为微软等客户推出60多款服务器

随着AI服务商越来越多，联想正从“卖标准化服务器”转向“按需定制”。杨元庆在沟通会上透露，联想已为微软等战略合作伙伴提供多达60多款AI基础设施，覆盖高性能训练服务器、推理服务器以及边缘计算节点。这些产品满足不同客户对功耗、延迟和成本的组合要求——例如某款推理服务器专门针对大模型API调用优化，可将单次推理成本降低至训练阶段的1/20。杨元庆表示，这种定制化服务是联想在AI军备竞赛中突围的核心竞争力。

算力结构重构：推理需求如何重塑数据中心生态

AI基础设施的爆发式增长背后，是算力分配逻辑的根本转变。过去数据中心追求“训练标杆”（如千万亿次浮点运算），未来数据中心将更关注“推理吞吐量”（每秒处理查询数）。杨元庆在财报会上特别提到，推理已成为AI基础设施新增投入最密集的方向之一，这不仅影响服务器硬件设计，还倒逼云服务商、芯片厂商和软件栈联合优化。例如，英伟达已推出针对推理的专用GPU变体，而联想则开始提供预装推理框架的整机方案。这一趋势意味着：高价值数据中心将从“训练中心”进化为“推理工厂”，并催生新的商业模式——按查询次数而非算力用量计费。

联想集团董事长杨元庆：相信未来 GPU 服务器 70% 用于推理，30% 用于训练

训练到推理的转折点：杨元庆预判GPU算力分配新格局

联想与英伟达高层对话：推理时代CPU为何重新回到舞台中央

定制化AI基础设施爆发：联想为微软等客户推出60多款服务器

算力结构重构：推理需求如何重塑数据中心生态

链接失效反馈