聊聊 Token 出海的生意经：模型开源给世界，中国赚什么？

3 个月前

AI资讯

75 阅读

开源 AI模型出海成本优化

中国开源AI模型凭借显著的技术突破和成本优势，正在重塑全球AI供应链的价值分配格局。以DeepSeek和Kimi为代表的中国模型，已从单纯的“追赶者”转变为技术范式的“定义者”。

DeepSeek的工程创新：通过MoE（混合专家模型）和MLA（多模态学习架构）技术，DeepSeek将训练成本压缩至Llama 3.1的十分之一（仅557.6万美元）。其R1模型更是采用纯强化学习（Pure RL），无需人工标注题库即达到OpenAI o1同级推理能力，被视为重走了没人走过的路。
Kimi的架构革新：Kimi K2.5开源后迅速登顶OpenRouter调用量榜首。其万亿参数的MoE架构在代码生成和Agent场景表现出色，推理成本仅为Claude的1/6至1/7。Kimi团队在底层架构上的创新（如Attention Residuals、MuonClip优化器）进一步挑战了行业既定范式。
性价比碾压：中国模型在保持高性能的同时，将价格降至行业极低水平。例如，V3将推理价格拉至OpenAI的几十分之一，这种巨大的“价差”直接引发了全球供应链的剧烈震荡。

中国开源模型正在成为全球AI应用开发的“原材料”，类似于实体制造业中中国供应链的地位。

B端案例：全球最火的AI编程工具Cursor，其Composer 2模型被证实底座为Kimi K2.5。尽管Cursor通过Fireworks AI获得授权并进行上层优化，但核心驱动力仍是中国模型提供的高性能低成本底座。这种模式下，Cursor估值飙升至500亿美元，而底座供应商Kimi估值为180亿美元，体现了应用层与模型层的估值博弈。
C端生态：以OpenClaw为代表的Agent框架（以及字节、腾讯等大厂跟进的类似框架）高度依赖中国模型。OpenRouter数据显示，中国模型在平台Token消耗中独占61%。在高频调用的Agent场景下，中国模型的低成本（如K2.5每百万输入0.5美元 vs Claude Sonnet 4.5的3美元）成为了应用能否跑通的关键。
基础设施化：类比Android开源生态，中国开源模型正在构建新的分层价值体系：模型权重和推理算力成为新“原材料”，全球开发者利用这些底座进行垂直场景优化，尽管品牌商（应用层）市值更高，但底层技术标准和话语权正逐渐向中国模型倾斜。

Token出海的生意经正在揭示新的商业价值流向。

Token即能源：阿里成立Token Hub事业群，将Token定位为“AI时代的水电煤”。中国通过提供低成本、大规模的Token（算力+电力），实现了Token出海变现。Cloudflare实测显示，使用K2.5可降低77%的推理成本。
估值倒挂与话语权：底层模型厂商与应用层厂商出现估值倒挂（如Cursor估值是Kimi的2.8倍），反映出市场对“离钱近”应用的偏好，但这并不代表底层话语权的丧失。DeepSeek和Kimi通过底层创新输出技术组件和方法论，类似于ARM指令集或台积电制程，在供应链中占据接近基础设施和标准制定者的位置。
开发者红利：低成本模型推动了AI工具的全球普及。开发者用脚投票，选择了性价比更高的中国模型，这不仅降低了开发门槛，也为底层厂商带来了巨大的流量和技术生态的粘性。

尽管势头强劲，中国开源模型的出海之路仍面临多重挑战。

商业矛盾与内部阻力：开源往往面临短期让利与长期回报的矛盾。例如MiniMax M2.7转为闭源，阿里千问技术负责人因开源冲突离职，Meta也可能放弃Llama开源路线。企业需要在“赚快钱”与“建生态”之间通过博弈找到平衡。
地缘政治与合规风险：随着中国模型在全球渗透率提升，数据主权问题成为硬伤。DeepSeek已在部分国家受限，美国对华AI管制政策（如芯片禁令）限制了算力的物理上限，使得算法优化必须更极致。
竞争窗口期：中国模型虽然通过算法优势部分抵消了硬件劣势，但时间窗口有限。未来的竞争将不仅仅是价格战，更是关于谁能定义Next Token的生成标准，谁就能掌握未来AI世界的基础设施话语权。