暴涨27倍,一群华人卖Token:年入22亿
估值27倍暴涨,年入22亿的Token生意
不到两年时间,Fireworks AI的估值从5.52亿美元飙升至150亿美元,翻了整整27倍。据彭博社报道,这家AI推理平台正在洽谈新一轮融资,目标估值高达150亿美元。而研究机构Sacra的数据显示,2026年2月,Fireworks AI的年化收入已达到3.15亿美元(约22亿元人民币),同比增长416%,相较于2024年B轮融资时增长了3到4倍。更惊人的是,该公司日均Token处理量已达到15万亿,接近中国全社会AI调用量的15%。这一切,都源于三位华人创始人在AI产业中开创的“卖水”模式——帮企业运行开源模型,按Token收费。
三位华人工程师,不造模型只卖水
Fireworks AI共有7位联合创始人,其中3位是华人。CEO乔琳(Lin Qiao)拥有复旦大学本科和硕士学位,以及UCSB博士学位,曾任Meta工程高级总监。另外两位华人联合创始人Benny Chen和Chenyu Zhao,分别在Meta做到首席软件工程师,以及长期负责Google Cloud Vertex AI相关业务。他们的公司不训练大模型,也不直接做AI应用,而是专注于一件事:帮助客户运行各种开源模型,然后按照Token调用量收费。AI应用跑得越猛,Fireworks赚得越多。全球最火的AI编程工具Cursor就是其客户,在该平台上实现了1000 token/秒的生成速度。
算力大反转:训练是成本,推理是印钞机
AI算力结构已经彻底反转。2023年,全球AI算力中训练占三分之二、推理仅占三分之一;到2026年,推理占比飙升至65%–70%,是训练算力的4.5倍。在中国,这一趋势更极端——推理算力已是训练算力的8倍。英伟达CEO黄仁勋甚至判断,未来推理规模将达到训练负载的十亿倍。过去,AI行业拼的是谁能训练更大的模型,一次训练成本动辄数亿美元。但现在,模型训练越来越像“一次性投入”,而推理调用开始变成“长期收费”。Fireworks AI正是抓住了这一转折点,与其他同类公司如Baseten(估值110亿美元)、Together AI(估值75亿美元)等一起,成为AI时代的“卖水人”,靠永续的Token调用收费,赚取长期、稳定的现金流。
15万亿Token日处理量背后的豪华股东团
Fireworks AI的股东名单越来越豪华,包括Lightspeed、Index Ventures、红杉资本,以及NVIDIA和AMD。NVIDIA曾公开表示,基于Blackwell架构的新一代推理系统已可将单Token成本降低约10倍,部分大模型场景下成本甚至可降至原来的1/35。这使得DeepSeek、Llama 3、Kimi等开源模型在推理成本上已接近甚至挑战GPT-4等闭源API,性价比拐点正式到来。目前,Fireworks AI的日Token处理量已从2025年底的10万亿增长到2026年5月的15万亿,5个月增长50%。按此速度,2026年底有望突破25万亿/日,全年处理量将超7000万亿Token,相当于为全球AI应用提供了近五分之一的推理算力支撑。其市销率约47倍,与同行相比并不离谱(Together AI约50倍,Baseten约18倍),核心支撑来自AI调用量的爆炸式增长。
结语:永续的Token收费才是AI真印钞机
Fireworks AI最值得关注的远不止150亿美元估值,而是“按Token收费”这一模式已真正形成商业规模。3.15亿美元年化收入、416%增速、15万亿日Token处理量,这些数字表明AI调用本身正在变成一门真正的大生意。过去很多人认为推理平台只是技术服务,但现在数据已经证明,它是能够持续产生现金流的印钞机。这也解释了为什么国内越来越多公司开始进入推理层,包括硅基流动、无问芯穹等,仅2025–2026年,国内新增推理赛道创业项目就超过200家。过去,AI行业拼的是谁能训练更大的模型;现在,越来越多人盯上了谁能替整个AI行业更低成本地“跑模型”。