营收暴增50倍,一季度赚一年的钱,今年最火生意是它
一季度赚了全年的钱:德明利净利润暴增50倍
今年A股最亮眼的业绩来自德明利。一季度财报显示,公司营收达到75.38亿元,同比增长5倍;净利润高达33.46亿元,同比暴增50倍。这意味着仅用一个季度就赚回了过去一整年的利润。自3月业绩季以来,公司股价已累计上涨3倍。如此炸裂的业绩背后,并非传统制造业的复苏,而是源于AI推理侧需求的井喷式爆发——火遍全网的“小龙虾”产品,让企业调用AI模型的需求每月环比增长超过20%,直接带动了芯片和算力服务商的业绩起飞。
卖Token的“卖水人”:Fireworks AI年入22亿,估值两年暴涨27倍
在美国,AI推理平台Fireworks AI正书写着同样的暴富故事。这家由华人团队创立的公司不训练大模型,而是专门帮企业运行开源模型并按照Token调用量收费。最新数据显示,其年化收入已达3.15亿美元(约22亿元人民币),同比增长416%,日处理Token量约15万亿,接近全中国AI调用量的15%。伴随收入爆发,公司估值也在不到两年内从5.52亿美元飙升至150亿美元,暴涨27倍。其客户包括全球最火的AI编程工具Cursor,后者在该平台上实现了每秒1000 Token的生成速度。本质上,Fireworks AI做的是AI时代的“卖水人”生意:模型训练是一次性投入,而推理调用是长期、持续的现金流水。
算力结构彻底反转:推理需求从配角变主角,占比65%成常态
整个AI行业的算力天平正在急剧倾斜。2023年,全球AI算力中训练占三分之二、推理仅占三分之一;但到2026年,推理算力占比预计飙升至65%–70%,是训练算力的4.5倍。在中国,这一趋势更为极端——推理算力已相当于训练算力的8倍。英伟达CEO黄仁勋甚至预言,未来推理负载规模将达到训练的十亿倍。这种结构性变化让“按Token收费”的商业模式从边缘走向主流。除了Fireworks AI,Baseten年化收入从年初2亿美元激增至Q1末的6亿美元,3个月增长200%;Together AI估值75亿美元,Modal估值46.5亿美元……这些AI推理平台纷纷以数十倍市销率获得资本追捧,核心逻辑是调用量仍在以每月两位数百分比的速度增长。
巨头亲自下场:NVIDIA投资推理平台,Token成本降至1/35
惊人的增速背后,是巨头在技术和资本上的双重押注。Fireworks AI的股东名单中已出现NVIDIA和AMD的身影。NVIDIA公开表示,基于Blackwell架构的新一代推理系统,已将单Token成本降低约10倍,在部分大模型场景下甚至降至原来的1/35。这意味着DeepSeek、Llama 3、Kimi等开源模型的推理成本已逼近甚至挑战GPT-4等闭源API,性价比拐点正式到来。更低的成本刺激更大的调用量:Fireworks AI日处理Token从10万亿增至15万亿,仅用了5个月。预计到2026年底,其日处理量有望突破25万亿——全年将为全球AI应用提供近五分之一的推理算力。
中国推理赛道涌出200+创业公司,谁能接住万亿Token红利?
Fireworks AI的爆发证明“按Token收费”已形成规模化商业闭环。这一模式正在中国快速复制。据不完全统计,仅2025至2026年,国内新增推理赛道创业项目超过200家,包括硅基流动、无问芯穹等AI Infra公司。过去两年,AI行业拼的是谁能训练更大的模型;如今,越来越多的玩家盯准了“谁能更低成本地跑模型”。当英伟达、AMD等硬件巨头不断将推理成本推向新低,当每个AI应用每秒钟都在产生Token消耗,一个以永续调用为核心的千亿级市场正在浮出水面。中国何时诞生自己的Fireworks AI?答案或许就在这些创业公司之中。