四个月烧光全年AI预算,为啥连Uber也烧不起token了?
四个月烧掉34亿?Uber的AI预算黑洞有多深
出行巨头Uber遭遇了一场令人瞠目的财务“翻车”——仅用了短短四个月,就耗尽了原本规划一整年的AI预算。据内部消息,这笔预算高达34亿美元,却在代码调试、模型调用等环节被迅速吞噬,最终“一无所获”。这种失控的速度迫使Uber不得不放缓招聘,用本应投入新项目的资金来支付高昂的AI账单。
每人每月1500美元:Uber的token“限流令”细节
为了止血,Uber紧急推出了一套严苛的token使用规则。每位员工在每款AI工具上的月度支出被锁定在1500美元以内,并且不同工具的额度完全隔离——一款工具超支不会影响其他工具的预算。员工可以通过内部仪表板实时查看自己的token消耗情况,一旦接近上限,系统便会发出警告。这种精细化的个人配额管理,在硅谷并非孤例,但Uber的激进程度凸显了预算危机的严重性。

Agent工作流引爆消耗:为什么AI编程工具成了“烧钱兽”
Uber的预算失控并非偶然,根源在于Agent工作流带来的Token消耗“爆炸式增长”。传统的单次提示消耗有限,但当AI被允许自主规划、执行多步骤任务时,每一次迭代、每一轮工具调用都会产生巨额token开销。以AI编程工具为例,Agent在修复一个bug时可能触发数十次代码生成、测试、重试的循环,而每次循环都需支付模型推理费用。Uber正是被这类“智能体”的隐形成本拖垮——员工看似高效地完成工作,后台的token账单却在指数级飙升。
连锁反应:从Uber到鹅厂,硅谷与国内巨头集体“急刹车”
Uber的困境迅速引发行业连锁反应。腾讯(鹅厂)等国内大型科技公司也紧急收紧AI工具使用权限,对Agent类应用实施限流。硅谷其他企业纷纷跟踪员工的token消耗数据,并开始部署“智能体熔断器”——一旦检测到无效循环或异常高消耗,系统会主动终止对话。这场由token经济引发的“降本”运动,正在从个别案例演变为整个AI行业的共性危机。
三重防线:企业如何重建AI预算的“防火墙”
面对Agent驱动的token黑洞,业内人士提出了一套“AI Gateway”三重防御体系。第一道防线是智能体熔断器:实时监控对话流程,当Agent陷入重复尝试或逻辑死循环时自动掐断。第二道防线是额度与角色绑定:为不同岗位设置差异化预算,比如初级工程师每月500美元,高级工程师可放宽至2000美元。第三道防线是消耗审计与反馈:通过仪表板让员工和管理层看见每一笔token的去向,并定期优化提示词模板以减少浪费。唯有从技术规则和财务纪律双管齐下,企业才能避免成为下一个Uber。