当 Token 越来越便宜,账单为什么越来越贵

AI开始干“重活儿”了

过去,人们用大模型聊天、写文案,一次任务消耗几百个Token。如今,AI被用于代码开发、复杂运维、金融分析等重量级Agent任务。以Claude Code修Bug为例,它需要读取整个代码仓库、分析依赖关系、调用工具并运行测试,用户最后看到的几百行代码改动,背后可能是几十万Token的消耗。智能体自动执行任务的Token消耗量是传统问答的4到15倍。Uber进入2026年没几个月就烧穿了全年AI预算,主因正是Claude Code。Django联合创始人Simon Willison一个月就消耗了价值2180.16美元的token。一位CTO在长达两小时的内部演示中,据报消耗了价值1200美元的词元。过去那种“模型便宜10倍,利润就能翻倍”的简单逻辑已经失效,因为任务复杂度的提升远远超过了单位价格的下降速度。

旗舰模型“不降价”的小算盘

虽然经济档和中档模型的价格在快速下跌,但顶级旗舰模型的价格却完全遵循另一套规则。武汉大学团队研究发现,旗舰模型价格做指数拟合的R²仅有0.031,几乎完全不降。推理模型相比普通模型还有平均31.5倍的溢价。这些顶级token正在“硬通货化”,价格由稀缺性和不可替代性决定,而非成本。OpenAI直接提价,把GPT-5.5的价格从每百万2.5/15美元提高到5/30美元。Anthropic则玩起了“暗涨”,虽然维持Opus 4.7的挂牌价不变,但通过新的tokenizer让相同文本的token量最多增加35%,有效成本达到Opus 4.6的1.4倍。这些涨价背后的逻辑很简单:买法拉利的人不会抱怨油耗,顶级模型的稀缺能力只要能完成任务,就不算浪费。

当 Token 越来越便宜,账单为什么越来越贵

企业开始管起“Token账本”

随着账单越来越贵,企业开始意识到“Token消耗量增长并不等于AI转型成功”。Uber甚至为工程师内部浪费现象造了一个词叫“Tokenmaxxing”(Token极大化)。微软内部因Claude Code的Token账单“难以为继”,开始削减相关授权。数据显示,每1美元Token的投入仅能产生18美分的真实价值。微软开始削减内部Claude Code许可,GitHub Copilot也从按请求收费切换为按Token用量计费,有开发者的月度费用预计从45美元飙升至超过847美元。亚马逊和Meta内部也曾出现员工为了刷榜AI使用量而做无意义任务的现象,最终被强制叫停。企业正从追求消耗量转向“单位有效行动成本”这一更健康的衡量维度。

工业级瓶颈:内存涨价了

除了模型本身,整个基础设施的成本也在上涨。AI需求的爆发打破了内存、硬盘等传统IT基础设施的供需平衡。思科表示,内存工厂的调整至少需要两年,2027年底之前不会好转。数据中心电力成本占60%左右,能源价格也在上涨。阿里云、百度云等云厂商相继宣布因全球AI需求爆发、供应链涨价,对AI算力、并行文件存储等产品上调5%至34%。这一轮涨价是整个硬件链条的集体应激反应,高端芯片的产能上去了,但配套设施没跟上。

两套路线的对赌:谁先跑通

全球AI行业正进行一场“持久战”对赌。美国玩家赌“不可替代性”的城墙足够厚,通过旗舰模型的提价收益持续投入下一代算力研发,维持其“最先进AI”的垄断地位。而中国玩家则赌这道墙会越来越薄,相信技术扩散的逻辑。DeepSeek把V4-Pro永久降到原价四分之一,价格仅为GPT-5.5的七分之一。智谱开源了编程能力达到Claude Opus 4.6的94.6%的GLM-5.1,且训练全程基于华为昇腾。火山引擎披露豆包大模型日均token已突破120万亿。中国玩家正试图通过工程化、规模化把原本稀缺的顶级能力做成大众可及的标准化商品,赌塔尖能力扩散的速度快于塔尖收租的速度。这场对赌的最终结果,将决定未来AI产业的定价权归属。