无问芯穹夏立雪:Agent牵动Token需求10倍增长,如何让中国成为“世界Token工厂”?

在2025年世界人工智能大会上,无问芯穹联合创始人、CEO夏立雪披露了一组关键数据:其所服务的人工智能孵化器——上海模速空间,日均Token调用量已突破100亿。这一里程碑不仅印证了大模型应用正加速渗透产业场景,更揭示了由Agent(智能体)驱动的结构性变革:需求正从传统的“人机对话”转向“智能体自主任务执行”,直接带动了Token消耗量的指数级增长。夏立雪指出,Agent的普及预计将使单个场景的Token需求量提升10倍以上,这对中国既是巨大的挑战,更是重塑全球AI基础设施格局的战略机遇。

Agent成为新引擎,Token需求呈指数级跃迁

过去一年,AI技术演进的核心趋势是从“Copilot(副驾驶)”向“Agent(智能体)”的范式转变。Copilot主要辅助人类完成单次、独立的任务,而Agent具备自主规划、调用工具、执行复杂流程的能力。这就意味着:

  • 任务复杂度提升:一个Agent可能需要检索海量文档、编写并执行多段代码、与多个外部API交互,整个过程涉及的上下文长度和交互轮次大幅增加。
  • 从“对话”到“生产”:需求从“快速获取答案”的低频、短交互,转变为“持续产出成果”的高频、长流程任务。例如,一个调研Agent可能为了完成一份报告,消耗的Token量是传统搜索或问答的几十上百倍。
  • 规模化部署:当企业开始在整个业务流程中(如客服、研发、数据处理)大规模部署Agent时,Token的总消耗量将呈现爆发式增长。夏立雪预判,这种由Agent牵动的需求增长,将使特定场景的Token消耗至少提升10倍。

模速空间突破百亿,验证规模化应用场景

上海模速空间作为全国首个乃至全球领先的大模型创新生态社区,其日均Token调用量突破100亿,是需求侧爆发的一个缩影。这一数据背后,体现了:

  • 产业聚集效应:模速空间汇聚了大量AI初创企业,它们正积极将大模型能力应用于金融、医疗、教育、文创等垂直领域,而Agent是这些企业产品落地的核心形态。
  • 真实商业价值:百亿Token并非来自实验室测试,而是源于真实的商业应用和用户调用,证明了应用侧已找到可持续的付费模式和价值闭环。
  • 需求验证:这一数字远超行业预期,直接验证了“模型即服务(MaaS)”和基于Token计费模式的商业可行性,为基础设施提供商指明了市场空间。

基础设施挑战:如何支撑十倍级增长

Token需求的激增对现有计算基础设施提出了严峻挑战。要将爆发的需求转化为可持续的业务,必须解决以下核心问题:

  • 算力成本与供给:十倍的需求增长需要十倍甚至更多的算力支撑。如何在保证高性能的同时,降低单位Token的计算成本,是全行业面临的难题。这不仅是硬件采购问题,更是能效、散热、芯片利用率的综合工程挑战。
  • 网络与传输效率:大规模的Token调用会产生海量的I/O和网络通信。如何优化集群网络架构,减少数据搬运的延迟和损耗,成为提升整体系统效率的关键。例如,采用更高速的光通信、优化网络拓扑、发展CPO(共封装光学)技术。
  • 软件与系统优化:硬件资源是基础,但软件层面的调度和优化同等重要。需要更高效的推理引擎、更智能的资源调度算法,来充分压榨硬件性能,实现“算力-Token”的最优转换。

“世界Token工厂”的战略构想

面对全球AI竞争,夏立雪提出了将中国打造为“世界Token工厂”的愿景。这不仅是产能的比拼,更是技术、成本和效率的全面竞赛。

  • 规模效应降本:依托中国庞大的市场和强大的制造业基础,可以通过大规模采购和部署,将算力基础设施的单位成本降至全球最低,从而提供最具价格竞争力的Token服务。
  • 技术栈全面优化:从芯片设计、服务器集成到集群管理、模型推理,构建全栈自主的技术能力。通过软硬协同优化,进一步提升能效比和算力利用率。无问芯穹这类致力于“端到端”优化的公司,正是此战略中的关键一环。
  • 服务全球市场:当中国能够以更低的成本、更高的效率、更稳定的供应提供大规模Token服务时,就能吸引全球的AI开发者和企业,将研发和应用部署在中国的算力网络上。这不仅能推动中国成为全球AI创新的基础设施提供者,更能将AI价值链的核心环节牢牢掌握在自己手中。