从“卖云”到“卖Token”:运营商全面加入AI战场

13 小时前
2 阅读

三大运营商集体转向:云业务不再是唯一重心

过去几年,三大运营商凭借网络和IDC优势,在云计算市场迅速崛起,成为仅次于阿里、腾讯的“第二梯队”。然而,随着AI大模型的爆发,单纯的“卖云”(出租虚拟机、存储、带宽)已经无法满足客户对计算密度的极致需求。运营商们开始将核心资源从“云资源”重新定义为“Token(令牌)”,即以AI生成的文字或代码单元为计量单位的全新服务形态。从中国电信的“星辰大模型平台”到中国移动的“九天”系列,再到中国联通的“格物”AI平台,运营商不再仅提供机架和带宽,而是直接输出“算力即Token”的能力,企业客户按调用量付费。

日均Token调用量破140万亿:AI算力需求爆炸

根据最新行业统计,国内日均Token调用量已突破140万亿大关,这一数字还在以每月超过30%的速度增长。这意味着,每秒钟就有超过16亿个Token被生成或处理,背后对应的是海量的GPU算力消耗。运营商手中的闲置GPU资源——原本用于网络运维和云存储加速——现在被全面激活。例如,中国移动已将其在内蒙古、贵州的超大规模数据中心改造成“AI算力池”,专门供应Token生成任务。一位运营商内部人士透露:“以前客户租机架,看的是U数;现在客户问的是‘你这儿能跑多少Token每秒?’”

英伟达订单排到2027:运营商如何应对算力饥渴?

AI算力供不应求的现状,让英伟达高端的H100/B200芯片订单已经排到了2027年。尽管下一代Rubin平台计划在2026年下半年量产,但产能爬坡至少需要半年,短期内“一卡难求”的局面无法缓解。运营商们不得不另寻出路:一方面,中国电信与中国联通联合采购国产AI芯片(如华为昇腾910B),试图构建自主可控的算力底座;另一方面,运营商开始推出“Token代工”服务——客户无需自购英伟达卡,只需向运营商提交模型和Prompt,运营商利用自己的GPU集群完成推理并输出Token,按调用量收费。这本质上是将“卖算力”打包成“卖Token”,降低客户门槛。

AI智能体消耗激增:单任务消耗是普通对话百倍

更让运营商意识到“卖Token”是未来主流的,是AI智能体(Agent)的爆发。相比普通用户与ChatGPT的简单问答,一个AI智能体在执行多步骤任务(如订机票、写报告、调用API)时,单次任务消耗的Token量是普通对话的10到100倍。例如,一个自动写代码的Agent,可能需要反复调用多个模型,产生几十万Token。运营商敏锐捕捉到这一变化:只要抓住Agent开发者和企业的Token调用入口,就能从“卖流量”变成“卖智能生产力”。中国移动已率先推出“Token贷”模式——为中小企业预授Token额度,先用后付,类似运营商的话费信用体系。这种模式让运营商的角色从“管道工”彻底变为“AI算力银行”。