Token五年增长370倍:谁在给AI公司“印钞机”充值?
摩根大通预言:370倍爆发的“数字石油”
摩根大通近期发布预测,中国的AI推理Token消耗量将从2025年的约10千兆飙升至2030年的约3900千兆,五年间增长约370倍。Token作为AI模型处理信息的最小单元,每一次用户提问、每一次模型回复都在消耗这种“数字石油”。这一爆炸式增长的背后,是AI从训练走向推理、从实验室走向千行百业的速度远超预期。当越来越多的企业将AI嵌入客服、编程、内容生成乃至无人驾驶场景时,Token便成了衡量AI经济体量的硬通货——每一次推理调用,都在为AI公司的“印钞机”充值。
谁是“充值者”?从算力云到广告主的接力赛
支撑Token消耗狂潮的,首先是庞大的算力基础设施。AWS已计划部署15万个含GB300的加速器,训练比上一代快5倍,推理性能功耗比优化10倍,单Token成本大幅降低。这直接推动AI公司以更低价格提供更多服务,形成“降价→用户激增→Token消耗高涨”的正循环。此外,超九成AI创业公司正困在“商业化”关口,它们一边烧钱买算力,一边探索变现模式——OpenAI一边自称研究公司,一边将广告视为“备选方案”,暗示旧互联网的广告模式可能成为冲印钞机的关键阀门。广告主、云客户、付费用户,都是这场Token狂欢的隐性充值者。

GPU之王NVIDIA:从Blackwell到Vera Rubin的万亿野望
NVIDIA创始人黄仁勋在Keynote上直言,从Blackwell到Vera Rubin,到2027年累计营收将突破一兆美元。推理爆发期被视作核心驱动力:随着代理式AI(Agentic AI)进入爆发期,AI不再仅是回答问题,而是自主执行任务——比如无人车遇水则瘫的案例,正倒逼模型需要更复杂、更长的推理链,单次任务消耗的Token量成倍增长。NVIDIA通过迭代GPU架构(如Blackwell升级款Rubin平台),不断降低单Token成本,同时让模型能处理更大上下文,进一步刺激推理需求。可以说,NVIDIA是这场Token淘金热中最大的“卖铲人”。
代理式AI与新场景:无人车、云与存储的连锁反应
Token增长的场景远不止聊天机器人。Waymo等无人车在暴雨中瘫痪的新闻,暴露了推理模型的脆弱性,也暗示着未来每辆车都需要实时Token分析来应对极端环境。云厂商和存储厂商同步受益:全球存储集体爆发,A股相关公司因AI数据洪流而股价飙升。训练和推理过程中,海量Token需要高速读写与缓存,DRAM和SSD需求激增。同时,代理式AI将让AI像人类一样规划(planning)、调用工具(tool use)、执行多步骤任务,每个任务消耗的Token可能是简单问答的数十倍。当AI开始替人购物、写报告、调试代码,Token就是它的“工资”——而企业正是发薪人。
商业化困局与破局:Token是成本还是收入?
Token消耗量激增的另一面,是AI创业公司的盈利难题。超九成公司困在商业化关口,一方面要支付高昂的推理成本(Token消耗越多,云账单越贵),另一方面用户对直接收费抵触强烈。OpenAI考虑广告,正是一种典型的“流量变现”思路——既然用户不愿为Token付钱,那就让广告商为用户的注意力付钱。但更值得关注的趋势是:当Token成本因芯片迭代而下降(如GB300的10倍性价比提升),AI公司将有能力以更低价格提供更智能的服务,从而吸引海量中小客户。届时,Token从成本项彻底转变为收入项——每一次推理都是印钞机的一次转动。五年370倍的增长,既是AI产业的激动人心号角,也是基础设施、商业模式与资本博弈的终极试炼场。