AI账单失控了吗?华尔街激辩“Token经济学
130万美元账单惊呆华尔街:一个月的AI能烧多少?
5月17日,Tom's Hardware爆出一条令人咋舌的消息:OpenClaw创始人一个月烧掉了130万美元的OpenAI账单——相当于消耗了6030亿tokens、760万次请求、100个Codex实例。这个数字像一颗炸弹投入平静的湖面,让华尔街分析师和科技高管们猛然惊醒:原来AI的Token账单可以膨胀到如此地步。老范在视频中直言“Token账单爆炸”,并质问企业是应该“停下来,还是继续烧?”这种情绪正是许多用户的真实写照——当月度账单突然飙升,第一反应往往是恐慌。
“Token经济学”新规则:从模型军备到成本效率
随着账单爆炸,华尔街开始激辩“Token经济学”的真正含义。戴鲲一针见血地指出:竞争逻辑正从“谁拥有性能更优、规模更大的模型”,转变为“谁能够凭借更低的Token成本、更高的工具链效率,有力支撑Agent的规模化”。这意味着,过去企业比拼的是自家大模型有多强,现在比拼的是能否用最少的Token解决最多问题。拥有专有数据源的公司甚至辩称,AI会增加其服务的价值,帮助从数据原材料中提取商业洞见——但前提是Token成本可控。否则,再好的模型也会被高昂的“按需付费”拖垮。
三大典型错误:为什么你的AI ROI看起来是零?
老范在视频中用三家公司案例拆解了企业AI投资的常见误区,这些错误直接导致“旧世界追问回报”时得到令人失望的答案:

- Amazon类错误:盲目用“Token榜单”衡量AI能力,以为哪家模型Token便宜就用哪家,结果忽略了任务匹配度,导致Agent频繁调用昂贵模型处理简单问题,成本反而更高。
- Meta类错误:用去年的预算管今年的AI支出。去年IT预算里可能根本没有Token这一项,今年突然冒出几百万美元Token账单,管理者立刻叫停,却扼杀了真正有价值的新应用场景。
- Uber类错误:要求AI必须立即产生收入回报。当AI被用于内部效率提升或长期探索时,短期看不到收入增长,就被打上“ROI失灵”标签,导致创新项目被腰斩。
这些错误的共同点:把AI当作传统SaaS软件来管理,用旧KPI、旧预算框架和旧问责制度去审视一项全新的技术范式。
模型分层与自动路由:省Token的实战战术
面对Token账单失控,务实的企业已经开始寻找出路。老范提出了“模型分层”和“自动路由”两大战术:
- 模型分层:不再让所有请求都涌向最贵的旗舰模型。对于简单分类、数据清洗等任务,使用轻量级模型(如DeepSeek系列),将Token单价降低一个数量级。
- 自动路由:智能判断请求复杂程度,自动分配给最合适的模型。复杂推理走GPT-4,简单查询走本地小模型,实现成本与质量的平衡。
- 省Token工具链:使用文本压缩、缓存、prompt精简等技巧,减少不必要的Token消耗。DeepSeek等国产模型的降价也提供了更多选择。
这些战术的核心不是“砍预算”,而是“给治理上纪律”——就像步枪射击需要纪律一样,AI调用也需要明确的规则和监控。
管理者的四句话:从管账单转向管客户价值
老范在视频结尾给企业管理者提出了四句话,或许能成为应对“Token经济学”的新指南:
- 别把Token当成水电费来管,它更像飞机燃料——水电费可以随便用,但飞机燃料每一次消耗都必须对应飞行任务。企业需要为AI调用设立明确的任务目标和价值衡量。
- 用目标管理取代账单管理——如果团队的目标是提升客户满意度,那就允许它烧Token去尝试新方案,只要最终客户满意度上升,账单就是合理的投资。
- 治理比管控更重要——不给Token上纪律,必然导致浪费。但纪律不是一刀切停止,而是像步枪案例那样:每个模型调用都要问“这个请求值不值这个Token?”
- 接受短期不确定性,锁定长期价值——AI的ROI可能不会在第一个月显现,就像当年的流量焦虑一样。关键在于持续跟踪“管目标和客户价值”,而不是盯着上个月的预算数字。
当华尔街还在为130万美元的账单争吵时,聪明的企业已经开始重塑自己的“Token经济学”:不是停下来,而是学会更聪明地烧钱。