未来推理将吃掉70%算力,30%留给训练丨硅谷投资人张璐@AIGC2026
算力天平彻底翻转:推理吃掉70%,训练只剩30%
过去几年,AI行业对算力的关注几乎全部集中在训练环节——训练一次大模型,动辄消耗数万张GPU。但硅谷知名投资人、Fusion Fund创始合伙人张璐在2026中国AIGC产业峰会上发出明确信号:这一格局正在被彻底颠覆。她指出,几年前训练与推理的算力占比还是70%对20%-30%,如今推理已经占到一半,而未来这一比例将变为30:70——推理将吃掉70%的算力,训练仅剩三成。
核心驱动力来自交互方式的演变。张璐解释,从简单的聊天对话转向智能体(Agent)交互后,用户希望AI永远在线、持续响应,这种持续性需求让推理的算力消耗从“一次性投入”变成了“长期刚需”。训练是烧钱建楼,而推理是持续运营——后者的算力需求更稳定、更巨大,也将成为AI基础设施最核心的优化方向。
数据中心里的“隐形电老虎”:通信耗电量是计算的百倍
当外界都在头疼AI数据中心“吃电”时,张璐揭示了一个更惊人的事实:真正的电老虎不是计算,而是通信。她在与Alphabet董事会主席、斯坦福前校长John Hennessy的对谈中得知,在AI数据中心内,通信环节的整体耗电量可能比计算本身高出几十倍甚至上百倍。原因在于,把数据从一个芯片挪到另一个芯片、从一个节点传到另一个节点,其能量消耗远超在本地执行计算。

这直接催生了对新一代通信技术的迫切需求。张璐强调,光学通信等前沿技术正在成为关键突破口——通过降低数据传输过程中的能耗,从底层重构数据中心的能耗结构。此外,通信层面还涉及交换机、内部互联等大量创新机会,这些环节以往被忽视,如今却可能成为决定AI基础设施效率的胜负手。
物理AI的拦路虎:数据荒,人工皮肤成破局利器
从语言模型到世界模型,再到物理AI,AI的进化正从虚拟世界踏入真实物理空间。但张璐指出,物理AI目前最大的瓶颈并非算力或架构——这两者都已具备,真正的卡点是数据。传统制造业、医疗、无人驾驶等领域产生了大量高质量的三维真实世界数据,却缺乏标准化的收集平台和数据治理工具,导致这些数据无法直接被用于AI训练。
一个令人眼前一亮的技术突破来自斯坦福大学鲍哲南教授团队的“人工皮肤”。这种基于柔性电路的传感器可以薄如手套,套在机械手或人手上,提供高精度的触觉数据,从而为物理AI提供关键的触觉输入。与此同时,边缘AI也在快速进化——张璐介绍,一家被高通收购的公司开发了不足10亿token的模型,可在树莓派上运行,性能与GPT-4相当。边缘端AI与新式数据收集平台结合,能在本地完成数据采集、处理和应用,尤其适合对隐私敏感的工业场景。
三大黄金赛道:医疗、太空与比细胞还小的机器人
张璐明确指出了三个最值得押注的AI应用方向:医疗、太空和纳米机器人。在医疗领域,2026年已成为关键转折年——礼来与英伟达达成10亿美元合作,Claude推出Claude for Health,默克与谷歌Gemini达成战略合作。AI医疗已从简单的问诊辅助,深入到个性化治疗,特别是脑部疾病(帕金森、老年痴呆、抑郁症)以及细胞疗法等垂直领域。物理AI与机器人也在生命科学实验中大规模部署,自动化整个科研流程。
太空领域同样是AI原生的天然舞台。随着SpaceX IPO临近,未来3-5年太空经济将高速崛起。从太空基础设施搭建、太空工厂到太空加油站,机器人将先于人类完成大量工作。张璐透露,相关公司已经获得上亿美元订单。
最令人兴奋的是纳米机器人——更小的机器人可以进入人类血管清除血栓,甚至可以缩小到DNA级别进行靶向药物递送。这项技术已进入商业化初期,例如微米机器人用于血栓清除,DNA引擎和纳米泳者则瞄准免疫隐形靶向给药。这些方向看似科幻,但张璐认为未来几年就将迎来快速发展。
“对于创业者来说,挑战就意味着机会。”张璐最后强调,500强企业的AI预算正从千万级跃升至数十亿级,采购周期从半年压缩到一两个月,这种产业整合的加速度才是AI落地的真正竞争力——只有快速进入真实场景,获取高质量数据,才能让模型和应用不断迭代。