老黄的Token经济学翻车了,微软亚马逊通通跳车

老板忘记设上限,一个月烧掉34亿

最近,Axios爆出了一个令人咋舌的消息:一家企业因为老板给员工开通Anthropic的Claude企业授权后,忘记设置用量上限,结果Token像失控的水龙头一样狂烧了一个月。最终,账单金额达到了5亿美元(约合34亿元人民币)。这一事件迅速成为AI圈的热议焦点,也揭开了Token经济学背后脆弱的成本管控逻辑。

Token经济学:看起来很美好,烧起来很恐怖

所谓的“Token经济学”,本质上是大模型厂商通过按Token计费的模式,将AI使用成本从固定投入转化为弹性支出。这种模式本意是降低企业入门门槛,让客户按需付费。然而,当企业使用量激增时,“弹性”立刻变成“无底洞”。上述事件中,5亿美元的账单相当于一家中型企业全年的IT预算,足够买下好几套传统机器学习系统。这暴露了Token经济学的核心问题:没有设置上限的弹性,等同于放任成本失控。

微软亚马逊通通跳车:巨头们开始说“不”

随着Token账单事件发酵,老黄(黄仁勋)力推的Token经济学开始遭到大客户的反噬。据报道,微软和亚马逊等云巨头纷纷调整策略,减少对单纯Token计费模式的依赖。微软Azure开始强调预付费合同和容量预留,避免客户因突发调用导致天价账单;亚马逊AWS则推出更细粒度的预算警报和熔断机制。这些举动被业内解读为“跳车”——巨头们不再盲目拥抱按Token付费,而是转向更可预测的固定成本模型。

企业AI成本管控的警示:三毛多一度的谷电才是答案

Token账单爆雷背后,隐藏着一个更深刻的矛盾:AI的算力消耗正在指数级增长,但企业的预算逻辑仍停留在传统IT的线性框架里。有分析指出,问题的答案或许不在于降低单价,而在于改变使用模式——比如利用“每晚三毛多一度的谷电”来调度非实时推理任务。那些忽略成本管控的企业,最终可能被Token账单压垮。而微软、亚马逊的“跳车”,恰恰是在提醒行业:AI不是用得多就好,成本可控才是可持续的基石。