聊聊 Token 出海的生意经:模型开源给世界,中国赚什么?
技术突围与成本革命:从追赶者到定义者
中国开源AI模型凭借显著的技术突破和成本优势,正在重塑全球AI供应链的价值分配格局。以DeepSeek和Kimi为代表的中国模型,已从单纯的“追赶者”转变为技术范式的“定义者”。
- DeepSeek的工程创新:通过MoE(混合专家模型)和MLA(多模态学习架构)技术,DeepSeek将训练成本压缩至Llama 3.1的十分之一(仅557.6万美元)。其R1模型更是采用纯强化学习(Pure RL),无需人工标注题库即达到OpenAI o1同级推理能力,被视为重走了没人走过的路。
- Kimi的架构革新:Kimi K2.5开源后迅速登顶OpenRouter调用量榜首。其万亿参数的MoE架构在代码生成和Agent场景表现出色,推理成本仅为Claude的1/6至1/7。Kimi团队在底层架构上的创新(如Attention Residuals、MuonClip优化器)进一步挑战了行业既定范式。
- 性价比碾压:中国模型在保持高性能的同时,将价格降至行业极低水平。例如,V3将推理价格拉至OpenAI的几十分之一,这种巨大的“价差”直接引发了全球供应链的剧烈震荡。
全球AI供应链的“中国底座”现象
中国开源模型正在成为全球AI应用开发的“原材料”,类似于实体制造业中中国供应链的地位。
- B端案例:全球最火的AI编程工具Cursor,其Composer 2模型被证实底座为Kimi K2.5。尽管Cursor通过Fireworks AI获得授权并进行上层优化,但核心驱动力仍是中国模型提供的高性能低成本底座。这种模式下,Cursor估值飙升至500亿美元,而底座供应商Kimi估值为180亿美元,体现了应用层与模型层的估值博弈。
- C端生态:以OpenClaw为代表的Agent框架(以及字节、腾讯等大厂跟进的类似框架)高度依赖中国模型。OpenRouter数据显示,中国模型在平台Token消耗中独占61%。在高频调用的Agent场景下,中国模型的低成本(如K2.5每百万输入0.5美元 vs Claude Sonnet 4.5的3美元)成为了应用能否跑通的关键。
- 基础设施化:类比Android开源生态,中国开源模型正在构建新的分层价值体系:模型权重和推理算力成为新“原材料”,全球开发者利用这些底座进行垂直场景优化,尽管品牌商(应用层)市值更高,但底层技术标准和话语权正逐渐向中国模型倾斜。
商业模式与估值逻辑的重构
Token出海的生意经正在揭示新的商业价值流向。
- Token即能源:阿里成立Token Hub事业群,将Token定位为“AI时代的水电煤”。中国通过提供低成本、大规模的Token(算力+电力),实现了Token出海变现。Cloudflare实测显示,使用K2.5可降低77%的推理成本。
- 估值倒挂与话语权:底层模型厂商与应用层厂商出现估值倒挂(如Cursor估值是Kimi的2.8倍),反映出市场对“离钱近”应用的偏好,但这并不代表底层话语权的丧失。DeepSeek和Kimi通过底层创新输出技术组件和方法论,类似于ARM指令集或台积电制程,在供应链中占据接近基础设施和标准制定者的位置。
- 开发者红利:低成本模型推动了AI工具的全球普及。开发者用脚投票,选择了性价比更高的中国模型,这不仅降低了开发门槛,也为底层厂商带来了巨大的流量和技术生态的粘性。
挑战与不确定性:开源的博弈
尽管势头强劲,中国开源模型的出海之路仍面临多重挑战。
- 商业矛盾与内部阻力:开源往往面临短期让利与长期回报的矛盾。例如MiniMax M2.7转为闭源,阿里千问技术负责人因开源冲突离职,Meta也可能放弃Llama开源路线。企业需要在“赚快钱”与“建生态”之间通过博弈找到平衡。
- 地缘政治与合规风险:随着中国模型在全球渗透率提升,数据主权问题成为硬伤。DeepSeek已在部分国家受限,美国对华AI管制政策(如芯片禁令)限制了算力的物理上限,使得算法优化必须更极致。
- 竞争窗口期:中国模型虽然通过算法优势部分抵消了硬件劣势,但时间窗口有限。未来的竞争将不仅仅是价格战,更是关于谁能定义Next Token的生成标准,谁就能掌握未来AI世界的基础设施话语权。