无问芯穹夏立雪：Agent牵动Token需求10倍增长，如何让中国成为“世界Token工厂”？

3 个月前

AI资讯

81 阅读

Agent AI工厂 Token经济算力需求

在2025年世界人工智能大会上，无问芯穹联合创始人、CEO夏立雪披露了一组关键数据：其所服务的人工智能孵化器——上海模速空间，日均Token调用量已突破100亿。这一里程碑不仅印证了大模型应用正加速渗透产业场景，更揭示了由Agent（智能体）驱动的结构性变革：需求正从传统的“人机对话”转向“智能体自主任务执行”，直接带动了Token消耗量的指数级增长。夏立雪指出，Agent的普及预计将使单个场景的Token需求量提升10倍以上，这对中国既是巨大的挑战，更是重塑全球AI基础设施格局的战略机遇。

Agent成为新引擎，Token需求呈指数级跃迁

过去一年，AI技术演进的核心趋势是从“Copilot（副驾驶）”向“Agent（智能体）”的范式转变。Copilot主要辅助人类完成单次、独立的任务，而Agent具备自主规划、调用工具、执行复杂流程的能力。这就意味着：

任务复杂度提升：一个Agent可能需要检索海量文档、编写并执行多段代码、与多个外部API交互，整个过程涉及的上下文长度和交互轮次大幅增加。
从“对话”到“生产”：需求从“快速获取答案”的低频、短交互，转变为“持续产出成果”的高频、长流程任务。例如，一个调研Agent可能为了完成一份报告，消耗的Token量是传统搜索或问答的几十上百倍。
规模化部署：当企业开始在整个业务流程中（如客服、研发、数据处理）大规模部署Agent时，Token的总消耗量将呈现爆发式增长。夏立雪预判，这种由Agent牵动的需求增长，将使特定场景的Token消耗至少提升10倍。

模速空间突破百亿，验证规模化应用场景

上海模速空间作为全国首个乃至全球领先的大模型创新生态社区，其日均Token调用量突破100亿，是需求侧爆发的一个缩影。这一数据背后，体现了：

产业聚集效应：模速空间汇聚了大量AI初创企业，它们正积极将大模型能力应用于金融、医疗、教育、文创等垂直领域，而Agent是这些企业产品落地的核心形态。
真实商业价值：百亿Token并非来自实验室测试，而是源于真实的商业应用和用户调用，证明了应用侧已找到可持续的付费模式和价值闭环。
需求验证：这一数字远超行业预期，直接验证了“模型即服务（MaaS）”和基于Token计费模式的商业可行性，为基础设施提供商指明了市场空间。

基础设施挑战：如何支撑十倍级增长

Token需求的激增对现有计算基础设施提出了严峻挑战。要将爆发的需求转化为可持续的业务，必须解决以下核心问题：

算力成本与供给：十倍的需求增长需要十倍甚至更多的算力支撑。如何在保证高性能的同时，降低单位Token的计算成本，是全行业面临的难题。这不仅是硬件采购问题，更是能效、散热、芯片利用率的综合工程挑战。
网络与传输效率：大规模的Token调用会产生海量的I/O和网络通信。如何优化集群网络架构，减少数据搬运的延迟和损耗，成为提升整体系统效率的关键。例如，采用更高速的光通信、优化网络拓扑、发展CPO（共封装光学）技术。
软件与系统优化：硬件资源是基础，但软件层面的调度和优化同等重要。需要更高效的推理引擎、更智能的资源调度算法，来充分压榨硬件性能，实现“算力-Token”的最优转换。

“世界Token工厂”的战略构想

面对全球AI竞争，夏立雪提出了将中国打造为“世界Token工厂”的愿景。这不仅是产能的比拼，更是技术、成本和效率的全面竞赛。

规模效应降本：依托中国庞大的市场和强大的制造业基础，可以通过大规模采购和部署，将算力基础设施的单位成本降至全球最低，从而提供最具价格竞争力的Token服务。
技术栈全面优化：从芯片设计、服务器集成到集群管理、模型推理，构建全栈自主的技术能力。通过软硬协同优化，进一步提升能效比和算力利用率。无问芯穹这类致力于“端到端”优化的公司，正是此战略中的关键一环。
服务全球市场：当中国能够以更低的成本、更高的效率、更稳定的供应提供大规模Token服务时，就能吸引全球的AI开发者和企业，将研发和应用部署在中国的算力网络上。这不仅能推动中国成为全球AI创新的基础设施提供者，更能将AI价值链的核心环节牢牢掌握在自己手中。

无问芯穹夏立雪：Agent牵动Token需求10倍增长，如何让中国成为“世界Token工厂”？

Agent成为新引擎，Token需求呈指数级跃迁

模速空间突破百亿，验证规模化应用场景

基础设施挑战：如何支撑十倍级增长

“世界Token工厂”的战略构想

链接失效反馈