暴涨27倍，一群华人卖Token：年入22亿

1 个月前

AI资讯

48 阅读

Token [AI 华人创业估值暴涨]

估值27倍暴涨，年入22亿的Token生意

不到两年时间，Fireworks AI的估值从5.52亿美元飙升至150亿美元，翻了整整27倍。据彭博社报道，这家AI推理平台正在洽谈新一轮融资，目标估值高达150亿美元。而研究机构Sacra的数据显示，2026年2月，Fireworks AI的年化收入已达到3.15亿美元（约22亿元人民币），同比增长416%，相较于2024年B轮融资时增长了3到4倍。更惊人的是，该公司日均Token处理量已达到15万亿，接近中国全社会AI调用量的15%。这一切，都源于三位华人创始人在AI产业中开创的“卖水”模式——帮企业运行开源模型，按Token收费。

三位华人工程师，不造模型只卖水

Fireworks AI共有7位联合创始人，其中3位是华人。CEO乔琳（Lin Qiao）拥有复旦大学本科和硕士学位，以及UCSB博士学位，曾任Meta工程高级总监。另外两位华人联合创始人Benny Chen和Chenyu Zhao，分别在Meta做到首席软件工程师，以及长期负责Google Cloud Vertex AI相关业务。他们的公司不训练大模型，也不直接做AI应用，而是专注于一件事：帮助客户运行各种开源模型，然后按照Token调用量收费。AI应用跑得越猛，Fireworks赚得越多。全球最火的AI编程工具Cursor就是其客户，在该平台上实现了1000 token/秒的生成速度。

算力大反转：训练是成本，推理是印钞机

AI算力结构已经彻底反转。2023年，全球AI算力中训练占三分之二、推理仅占三分之一；到2026年，推理占比飙升至65%–70%，是训练算力的4.5倍。在中国，这一趋势更极端——推理算力已是训练算力的8倍。英伟达CEO黄仁勋甚至判断，未来推理规模将达到训练负载的十亿倍。过去，AI行业拼的是谁能训练更大的模型，一次训练成本动辄数亿美元。但现在，模型训练越来越像“一次性投入”，而推理调用开始变成“长期收费”。Fireworks AI正是抓住了这一转折点，与其他同类公司如Baseten（估值110亿美元）、Together AI（估值75亿美元）等一起，成为AI时代的“卖水人”，靠永续的Token调用收费，赚取长期、稳定的现金流。

15万亿Token日处理量背后的豪华股东团

Fireworks AI的股东名单越来越豪华，包括Lightspeed、Index Ventures、红杉资本，以及NVIDIA和AMD。NVIDIA曾公开表示，基于Blackwell架构的新一代推理系统已可将单Token成本降低约10倍，部分大模型场景下成本甚至可降至原来的1/35。这使得DeepSeek、Llama 3、Kimi等开源模型在推理成本上已接近甚至挑战GPT-4等闭源API，性价比拐点正式到来。目前，Fireworks AI的日Token处理量已从2025年底的10万亿增长到2026年5月的15万亿，5个月增长50%。按此速度，2026年底有望突破25万亿/日，全年处理量将超7000万亿Token，相当于为全球AI应用提供了近五分之一的推理算力支撑。其市销率约47倍，与同行相比并不离谱（Together AI约50倍，Baseten约18倍），核心支撑来自AI调用量的爆炸式增长。

结语：永续的Token收费才是AI真印钞机

Fireworks AI最值得关注的远不止150亿美元估值，而是“按Token收费”这一模式已真正形成商业规模。3.15亿美元年化收入、416%增速、15万亿日Token处理量，这些数字表明AI调用本身正在变成一门真正的大生意。过去很多人认为推理平台只是技术服务，但现在数据已经证明，它是能够持续产生现金流的印钞机。这也解释了为什么国内越来越多公司开始进入推理层，包括硅基流动、无问芯穹等，仅2025–2026年，国内新增推理赛道创业项目就超过200家。过去，AI行业拼的是谁能训练更大的模型；现在，越来越多人盯上了谁能替整个AI行业更低成本地“跑模型”。