国产算力正在进入Token标准化时代

千倍增长的Token洪流正重塑算力市场

据国家数据局统计,截至2026年3月,中国日均Token调用量已突破140万亿,两年间增长超过1000倍。这一指数级增长的背后,是生成式AI向智能体的全面跃迁。云计算服务商优刻得观察到,其平台上单月Token消费金额已出现“月末是月初1.5至2倍”的加速信号,意味着企业正从“测试调用”走向“常态化生产”。硅基流动的日均Token生成量已达数万亿量级,服务超1000万用户和1万家企业客户。推动需求飙升的三大动力包括:头部大模型公司训练与推理算力持续飙涨、垂直行业模型进入规模化投入期,以及AI Agent单次任务Token消耗量远超传统对话场景。阿里巴巴CEO吴泳铭坦言:“服务器没有一张卡是空着的,客户排队的还很多。”算力供不应求的局面,直接催生了Token作为新计量单位的商业化浪潮。

国产算力正在进入Token标准化时代

三大运营商争相推出Token套餐

当Token成为智能经济的“硬通货”,运营商正从“卖带宽”转向“卖Token”。中国电信推出系列试商用Token套餐:个人用户每月9.9元享1000万Tokens,企业开发者每月39.9元起售,并发行“天翼Token币”作为统一量纲。上海移动宣布5G-A超级上行网络规模商用,1元可购40万Tokens,支持话费支付。中国联通发布全栈国产化“国芯国模国云”安全基座,推出多档Token产品及融合套餐。麦肯锡研报指出,AI基础设施需要数据中心、光纤、边缘计算、供电与GPU算力等多类资产,运营商天然掌握这些资源。当云厂商还在卷大模型参数时,运营商已通过“Token工厂”模式将算力生产工业化——如中国电信宁夏分公司2026年Token工厂集采项目规模达164.51亿元,弘信电子与无锡高新区打造的华为昇腾384超节点集群首批已投产。这些举措标志着算力正像水电一样实现标准化计量、交易与流通。

国产芯片加速追赶但生态仍是硬伤

面对Token需求的暴增,国产算力芯片迎来窗口期。2025年中国AI加速卡市场国产厂商出货165万张,份额突破41%(华为昇腾出货81.2万张,居国产第一;寒武纪2026年Q1净利润同比暴增185%)。中国移动、中国电信已建成多个万卡级智算中心,采用昇腾或寒武纪等国产芯片,累计投资超百亿元。然而,现实的挑战同样尖锐:优刻得指出,国产芯片在软件生态支撑丰富度、CUDA兼容性、卡间互联能力(PCIe与NVLink的代差)上仍有显著差距;魔形智能陆嘉骏直言,严格来说不是算力供不应求,而是Token供不应求——按当前Token价格,纯商业化项目使用国产芯片基本亏损,高昂的生产成本主要受制于芯片性能。业内专家邓中翰院士总结三大核心挑战:技术适配性不足、生态体系有短板、算力利用效率低。为此,行业正从“芯片孤岛”转向“芯模共进”的系统级竞争,即通过模型需求反向驱动芯片迭代,形成“芯片—模型—系统”协同优化的新周期。

AI产业竞争核心从MaaS转向TaaS

随着Token成为智能时代的基本计量单位,AI产业竞争逻辑正在发生根本跃迁。中国工程院院士郑纬民指出:“未来AI竞赛的核心标准正在从MaaS(模型即服务)向TaaS(Token即服务)跃迁,从比拼算力集群规模彻底转向比拼每瓦Token生产效率。”这意味着,算力的计价逻辑从“资源时长”转向“服务消耗”,客户不再关心租用了多少GPU,而是关心消耗了多少Token、响应是否稳定、成本是否可控。CIC灼识董事总经理董晓雅认为,算力租赁厂商需要从“硬件出租商”进化为“AI基础设施服务商”,商业模式演变为“基础租金+用量计费+效果分成”的混合模式。与此同时,城市AI发展也需从要素配置、应用落地和制度能力三个层面协同发力,将技术突破转化为真实生产力。北电数智CMO杨震表示,AI规模化落地的核心障碍在于“部署复杂、成本高、难以复制”,必须构建“数算模用”一体化的全栈能力,让国产算力真正从“可用”走向“好用”,最终实现普惠智能。