一月烧掉5亿美元才醒悟:把 Token 当 KPI是AI转型里最贵的坑,亚马逊连夜撤下排行榜
一个月烧掉5亿美元:AI账单让高管从狂热到清醒
据Axios报道,一家科技公司因忘记为员工的Claude许可证设置上限,在短短一个月内消耗了5亿美元的Token。虽然报道未点名,但外界普遍认为这家公司是亚马逊——后者曾大力推行AI工具,甚至将开发者AI使用量纳入内部排行榜考核。Uber的案例同样触目惊心:为约5000名工程师部署Claude Code后,仅四个月就烧光了全年AI预算,每个工程师每月API成本高达500到2000美元。Uber CEO直言,极端的Token消耗量与推出真正有价值的产品之间“毫无关系”。微软旗下的核心工程团队在全面推行Claude Code六个月后,也不得不紧急叫停,关闭大部分授权,强制员工迁回成本更低的GitHub Copilot CLI。
Token排行榜催生“刷量”闹剧,亚马逊与Meta紧急撤榜
亚马逊旗下开发者平台Kiro曾设有一个名为“Kirorank”的内部排行榜,根据员工AI使用活跃度评分。这一考核机制迅速催生了“Tokenmaxxing”现象——员工用MeshClaw自动化那些根本不需要AI的日常任务,让AI智能体在后台空转,只为刷高排行榜数据。亚马逊高级副总裁Dave Treadwell本周向员工承认,这一排行榜“出发点是好的,但最终结果是员工通过Tokenmaxxing推高了公司的运营成本”,并明确要求员工“不要为了用AI而用AI”。类似闹剧也在Meta上演:Meta内部出现了一个名为“Claudeonomics”的非官方排行榜,追踪全公司约8.5万名用户的Token消耗量,30天内总使用量超过60万亿个Token,排行榜曝光两天后因“内部数据遭外部获取”而紧急下线。Meta首席人力官原计划从2026年起将AI使用量纳入绩效考核,但高额的账单让公司不得不重新审视这一政策。

成本失控的三大病灶:用例错位、缺乏管控与人的瓶颈
Velastegui Ventures CEO、前微软首席AI官Sophia Velastegui指出,企业普遍陷入三个误区。首先是用例选择错位:大多数人倾向于用AI自动化自己不喜欢的工作(如查天气、做重复性任务),而非对公司最有价值的工作。其次是成本缺乏管控:企业级套餐按Token计费,即便是简单查询也会快速累积成可观支出,多数业务部门对此并无清晰认知。第三是人的瓶颈:目前“撒花”式AI授权无法带来实质回报。专注金融AI的Boosted.ai CEO Josh Pantony补充说,当企业因数据安全顾虑不愿向AI代理开放专有数据时,代理的实际效能大打折扣,投资回报自然无从谈起。高盛分析师Jim Schneider指出,AI供应链中几乎所有价值都流向了半导体公司,芯片公司的繁荣是以整条产业链上游消耗为代价,“Token消耗量增长等于AI转型成功”的简单等式已经被打破。
Token通缩≠AI能力普惠,企业从“大水漫灌”转向ROI审查
尽管Token价格在下降(DeepSeek定价下调75%,小米MiMo降价近99%),但Gartner高级分析师威尔·萨默警告:“不要把Token的降价误读为AI能力的普惠。”智能体工作流消耗的Token量是普通对话的数百倍,消费量的增长完全足以淹没单价下降的红利。高盛预测,到2030年代理式AI将推动Token消耗量增长24倍,但企业面临的成本压力并未减轻。Uber COO直言:“AI成本越来越难以合理化。”Salesforce CEO马克·贝尼奥夫希望出现一种“智能路由器”,判断哪些任务需要高性能模型,哪些可以交给低成本替代模型。研究显示,85%的企业AI成本预测误差超过10%,84%的企业表示AI支出已将毛利率压低6个百分点以上。
反转时刻:AI替代人力的泡沫破裂,企业重新开始招人
瑞典金融科技巨头Klarna曾是AI替代人工最激进的鼓吹者,2024年以“AI能胜任人类所有工作”为由冻结招聘、裁减1200人。然而到2026年初,Klarna悄然重启人工客服招募,并承认“成本成为过于主导的评估因素,结果导致服务质量下降”。澳大利亚联邦银行同样在2025年用AI语音机器人替代45名客服后遭遇灾难性后果:来电量不降反升,顾客投诉激增,剩余员工被迫加班,一个月后被迫道歉并邀请员工返岗。研究机构Orgvue和Forrester的调查显示,急于用AI替代人力的企业中有55%事后表示后悔。从英伟达黄仁勋曾宣称“员工烧不完50万美元Token我会失望”,到亚马逊高管告诫“不要为了用AI而用AI”,不到半年时间,硅谷对Token的态度完成180度转弯。下一笔AI账单能产生多少真实价值,将是这场豪赌真正的判决时刻。