一天烧1亿:第一次“Token大撤退”,来了

运营商开卖AI流量包,9.9元套餐为何无人喝彩?

三大运营商几乎同步推出了Token套餐:上海移动“1元40万Tokens”,中国电信最低9.9元/月,中国联通为上海OPC客户免费提供3000万Tokens测试额度。这被包装成“AI算力进话费账单”的标志性事件,资本市场也给出积极反馈,股价接连上涨。

但消费端反应冷淡。一位云厂商产品负责人直言:“运营商套餐首月9.9元,但吞吐首个词就要5分钟,效率极低,调用的大模型也不聪明。”有用户更直接:“我要的是GPT 5.5或Claude 4.7的Token,运营商那些模型能比吗?”甚至运营商内部员工都尚未被告知有此套餐。表面上是将Token像水电一样明码标价,实际上是传统通信巨头面对三重压力下的自救:2025年三家营收增速均跌破1%(移动0.9%、电信0.1%、联通0.7%),流量收入下降3.1%而流量却增长17.3%,ARPU持续下滑。同时,工信部数据显示日均Token调用量从2024年初的1000亿飙升至2026年3月的140万亿,但这项增长对应的算力基础设施投资却在暴涨——中国电信2026年算力投资同比增26%至255亿元,占总投资35%。投资压下去,必须找到新变现方式。

云厂商反击:平台锁定与模型涨价,谁在收割开发者?

面对运营商以低价杀入,云厂商并不惊慌。阿里云、腾讯云、火山引擎早已布局Token Plan,但核心逻辑是“平台锁定”——不单卖Token,而是捆绑“模型超市+开发工具+企业级服务”。例如阿里云百炼Token Plan团队版按坐席198元/月起,提供多模型调度、Agent开发框架;火山引擎Coding Plan绑定豆包生态。阿里云千问云产品负责人承认运营商构成价格竞争压力,但强调自身优势在于基础设施稳定性、品牌信任度与开发者工作流闭环——“开发者一旦接入我的平台,换平台迁移成本很高”。

而模型厂商则两面受压:智谱AI的Coding Plan涨价30%起,腾讯云自研模型API价格涨幅最高达463%,阿里云百炼、百度智能云也相继提价。这轮涨价被解读为“从补贴抢市场到按商业价值定价的集体撤退”。MiniMax、小米MiMo等也陆续推出Token Plan,但MiniMax全球首个全模态Token Plan仅29元/月起,看似便宜,实则算力成本压力巨大。字节Seedance 2.0日Token消耗已突破7000万元,但火山引擎总裁坦言“我们还没有做3年的盈利规划”。

Token补贴时代终结:从9.9元赔本赚吆喝到普遍涨价30%

2025年下半年到2026年初,各大厂商曾密集推出低价Coding Plan(编程订阅套餐),MiniMax首月9.9元、火山方舟首月8.91元,近乎“赔本赚吆喝”。核心逻辑是Agent时代Token消耗暴增,先圈用户再变现。但这个逻辑在2026年破灭,因为算力成本远超预期——当大模型从聊天工具进化为Agent执行引擎,单次任务消耗Token从几百变成几万甚至几十万,每天烧掉上亿。智谱率先涨价30%起,腾讯云最高提价463%,阿里云、百度智能云跟进。

市场出现奇妙分裂:C端套餐价格被运营商压到9.9元/月,但B端开发者API价格在涨。实际上运营商的9.9元套餐折算成百万Token单价并不比云厂商按量计费低多少,其优势不在于“更便宜”而在于“更省事”——将Token与话费、宽带打包,降低心理门槛。小米的罗福莉点出关键:低效的Agent框架可能把简单任务变成几十万Token消耗,高效框架同样事情只需几千Token。这意味着未来竞争不是“谁的Token更便宜”,而是“谁的Token能办更多事”。

一天烧1亿:算力成本压垮价格战,Token经济回归理性

日均140万亿Token调用量背后是天量算力成本。字节Seedance 2.0虽然收入可观,但日消耗7000万仍无盈利时间表。微软已开始取消大部分员工的Claude Code内部许可,截止日期正是财年最后一天——显然也在严格控制内部Token开支。Token经济学真正的护城河不是定价权,而是单位Token的价值产出。谁能用更少Token完成更复杂任务,谁就能在新体系中掌握主动权。

三大运营商的入场打开了AI算力普惠化大门,但这扇门后站着的不再是挥金如土的补贴者,而是精打细算的经营者。对企业和开发者而言,“低价战争”已经结束,Token定价正在回归理性。未来合纵连横、效率竞争将决定谁能从这场“大撤退”中真正获利。