从“卖云”到“卖Token”：运营商全面加入AI战场

1 个月前

AI资讯

44 阅读

AI Token 算力运营商

三大运营商集体转向：云业务不再是唯一重心

过去几年，三大运营商凭借网络和IDC优势，在云计算市场迅速崛起，成为仅次于阿里、腾讯的“第二梯队”。然而，随着AI大模型的爆发，单纯的“卖云”（出租虚拟机、存储、带宽）已经无法满足客户对计算密度的极致需求。运营商们开始将核心资源从“云资源”重新定义为“Token（令牌）”，即以AI生成的文字或代码单元为计量单位的全新服务形态。从中国电信的“星辰大模型平台”到中国移动的“九天”系列，再到中国联通的“格物”AI平台，运营商不再仅提供机架和带宽，而是直接输出“算力即Token”的能力，企业客户按调用量付费。

日均Token调用量破140万亿：AI算力需求爆炸

根据最新行业统计，国内日均Token调用量已突破140万亿大关，这一数字还在以每月超过30%的速度增长。这意味着，每秒钟就有超过16亿个Token被生成或处理，背后对应的是海量的GPU算力消耗。运营商手中的闲置GPU资源——原本用于网络运维和云存储加速——现在被全面激活。例如，中国移动已将其在内蒙古、贵州的超大规模数据中心改造成“AI算力池”，专门供应Token生成任务。一位运营商内部人士透露：“以前客户租机架，看的是U数；现在客户问的是‘你这儿能跑多少Token每秒？’”

英伟达订单排到2027：运营商如何应对算力饥渴？

AI算力供不应求的现状，让英伟达高端的H100/B200芯片订单已经排到了2027年。尽管下一代Rubin平台计划在2026年下半年量产，但产能爬坡至少需要半年，短期内“一卡难求”的局面无法缓解。运营商们不得不另寻出路：一方面，中国电信与中国联通联合采购国产AI芯片（如华为昇腾910B），试图构建自主可控的算力底座；另一方面，运营商开始推出“Token代工”服务——客户无需自购英伟达卡，只需向运营商提交模型和Prompt，运营商利用自己的GPU集群完成推理并输出Token，按调用量收费。这本质上是将“卖算力”打包成“卖Token”，降低客户门槛。

AI智能体消耗激增：单任务消耗是普通对话百倍

更让运营商意识到“卖Token”是未来主流的，是AI智能体（Agent）的爆发。相比普通用户与ChatGPT的简单问答，一个AI智能体在执行多步骤任务（如订机票、写报告、调用API）时，单次任务消耗的Token量是普通对话的10到100倍。例如，一个自动写代码的Agent，可能需要反复调用多个模型，产生几十万Token。运营商敏锐捕捉到这一变化：只要抓住Agent开发者和企业的Token调用入口，就能从“卖流量”变成“卖智能生产力”。中国移动已率先推出“Token贷”模式——为中小企业预授Token额度，先用后付，类似运营商的话费信用体系。这种模式让运营商的角色从“管道工”彻底变为“AI算力银行”。

从“卖云”到“卖Token”：运营商全面加入AI战场

三大运营商集体转向：云业务不再是唯一重心

日均Token调用量破140万亿：AI算力需求爆炸

英伟达订单排到2027：运营商如何应对算力饥渴？

AI智能体消耗激增：单任务消耗是普通对话百倍

链接失效反馈