见顶 ,Token烧不动了?这可能是全市场最重要的一张图
一张图拉响警报:全市场最重要的“Token”信号
5月前还在飙升的Token支出指数,近期出现罕见的回落。宏观策略师Andreas Steno Larsen直言,如果Token定价持续走弱,从内存到更广泛的硬件及数据中心交易可能宣告结束。该指数衡量的是全市场每百万大语言模型Token的支付价格,被视为AI边际支付意愿的替代指标。它的停滞,直接引发了对硬件周期的担忧——为增量GPU、DRAM和数据中心采购提供资金的边际收入正在减弱,而那些围绕Token驱动增长制定资本开支计划的巨头,风险状况已经改变。华尔街正在重新审视这笔科技账单的可持续性。
巨头开始“烧不动Token”了
- 一张价值5亿美元的账单,点燃了科技界的恐慌。一家忘记为Claude许可证设置使用上限的公司,一个月内就烧掉了这个天文数字。这并非孤例:Uber在2026年前四个月就耗尽了全年的“Token预算”;微软紧急收紧了内部AI工具权限,关停大部分Claude Code授权;亚马逊叫停了内部的AI使用排行榜,高管公开告诫员工“不要为了用AI而用AI”。当Meta、亚马逊等巨头纷纷收紧内部Token消耗指标,一场从“不惜一切代价”到“追求合理回报”的转折已经到来。

Token是如何从“白菜价”变成“奢侈品”的
- 2024年还在被嘲笑“不如卖矿泉水”的Token,如今价格暴涨。背后是供给端的结构性瓶颈:HBM高带宽内存价格涨幅超50%,CoWoS封装产能排到2026年年底,一台英伟达B300服务器报价飙升至700万元还被秒杀。全球AI算力每年增长3.4倍,而Token需求增速却达每年10倍。当市场“租”AI的能力取代了过去“买”机器的方式,复杂任务的Token消耗呈指数级爆炸,硬件成本的结构性上涨直接推高了API价格,GPT-5.5、Gemini、Claude相继涨价。AI的成本神话,已被击得粉碎。
为什么越烧Token,产出越少?
- “Tokenmaxxing”这一内部排行榜催生的荒谬现象,揭示了高昂账单背后的“人祸”。员工让AI执行无意义任务以刷高排名,导致大量算力被无效消耗。Entelligence.AI对2444家企业的统计显示:投入1美元AI Token费用,只有18美分产生了实际价值,高达44美分被用来修复AI自身引入的Bug。Meta的工程师甚至利用公司Token接私活。当简单任务被复杂循环思考、Agent“永不下班”取代,单次请求的Token消耗从几百跃升到上百万,内部激励机制本身成为效率的最大讽刺。微软自己都承认,即使动用自家云资源,AI的按量计费模式依然成本高昂到难以承受。
出路在哪里?从“烧钱竞赛”回归“价值创造”
- 面对成本失控,行业正从三个维度寻找出路:
- 技术降本:DeepSeek通过架构优化将训练成本降至前沿模型的十分之一,API价格仅为同类十六分之一,为行业提供了可借鉴的范式。
- 管理增效:亚马逊关闭鼓励内卷的排行榜,转向衡量AI辅助代码的实际交付;Uber制定了分级管理制度。从“用量考核”到“结果考核”,企业态度已彻底转变。
- 商业变现:豆包、文心一言等开始推出付费订阅,Anthropic将Claude企业版从固定订阅转向“基础费+按算力消耗”的混合模式,AI成本最终将转移至终端用户。这并非短期的价格波动,而是整个AI产业结构性洗牌的开始。