当 Token 越来越便宜，账单为什么越来越贵

2 小时前

AI资讯

1 阅读

智能体 Token消耗大模型][AI成本

AI开始干“重活儿”了

过去，人们用大模型聊天、写文案，一次任务消耗几百个Token。如今，AI被用于代码开发、复杂运维、金融分析等重量级Agent任务。以Claude Code修Bug为例，它需要读取整个代码仓库、分析依赖关系、调用工具并运行测试，用户最后看到的几百行代码改动，背后可能是几十万Token的消耗。智能体自动执行任务的Token消耗量是传统问答的4到15倍。Uber进入2026年没几个月就烧穿了全年AI预算，主因正是Claude Code。Django联合创始人Simon Willison一个月就消耗了价值2180.16美元的token。一位CTO在长达两小时的内部演示中，据报消耗了价值1200美元的词元。过去那种“模型便宜10倍，利润就能翻倍”的简单逻辑已经失效，因为任务复杂度的提升远远超过了单位价格的下降速度。

旗舰模型“不降价”的小算盘

虽然经济档和中档模型的价格在快速下跌，但顶级旗舰模型的价格却完全遵循另一套规则。武汉大学团队研究发现，旗舰模型价格做指数拟合的R²仅有0.031，几乎完全不降。推理模型相比普通模型还有平均31.5倍的溢价。这些顶级token正在“硬通货化”，价格由稀缺性和不可替代性决定，而非成本。OpenAI直接提价，把GPT-5.5的价格从每百万2.5/15美元提高到5/30美元。Anthropic则玩起了“暗涨”，虽然维持Opus 4.7的挂牌价不变，但通过新的tokenizer让相同文本的token量最多增加35%，有效成本达到Opus 4.6的1.4倍。这些涨价背后的逻辑很简单：买法拉利的人不会抱怨油耗，顶级模型的稀缺能力只要能完成任务，就不算浪费。

当 Token 越来越便宜，账单为什么越来越贵

企业开始管起“Token账本”

随着账单越来越贵，企业开始意识到“Token消耗量增长并不等于AI转型成功”。Uber甚至为工程师内部浪费现象造了一个词叫“Tokenmaxxing”（Token极大化）。微软内部因Claude Code的Token账单“难以为继”，开始削减相关授权。数据显示，每1美元Token的投入仅能产生18美分的真实价值。微软开始削减内部Claude Code许可，GitHub Copilot也从按请求收费切换为按Token用量计费，有开发者的月度费用预计从45美元飙升至超过847美元。亚马逊和Meta内部也曾出现员工为了刷榜AI使用量而做无意义任务的现象，最终被强制叫停。企业正从追求消耗量转向“单位有效行动成本”这一更健康的衡量维度。

工业级瓶颈：内存涨价了

除了模型本身，整个基础设施的成本也在上涨。AI需求的爆发打破了内存、硬盘等传统IT基础设施的供需平衡。思科表示，内存工厂的调整至少需要两年，2027年底之前不会好转。数据中心电力成本占60%左右，能源价格也在上涨。阿里云、百度云等云厂商相继宣布因全球AI需求爆发、供应链涨价，对AI算力、并行文件存储等产品上调5%至34%。这一轮涨价是整个硬件链条的集体应激反应，高端芯片的产能上去了，但配套设施没跟上。

两套路线的对赌：谁先跑通

全球AI行业正进行一场“持久战”对赌。美国玩家赌“不可替代性”的城墙足够厚，通过旗舰模型的提价收益持续投入下一代算力研发，维持其“最先进AI”的垄断地位。而中国玩家则赌这道墙会越来越薄，相信技术扩散的逻辑。DeepSeek把V4-Pro永久降到原价四分之一，价格仅为GPT-5.5的七分之一。智谱开源了编程能力达到Claude Opus 4.6的94.6%的GLM-5.1，且训练全程基于华为昇腾。火山引擎披露豆包大模型日均token已突破120万亿。中国玩家正试图通过工程化、规模化把原本稀缺的顶级能力做成大众可及的标准化商品，赌塔尖能力扩散的速度快于塔尖收租的速度。这场对赌的最终结果，将决定未来AI产业的定价权归属。

当 Token 越来越便宜，账单为什么越来越贵

AI开始干“重活儿”了

旗舰模型“不降价”的小算盘

企业开始管起“Token账本”

工业级瓶颈：内存涨价了

两套路线的对赌：谁先跑通

链接失效反馈