Coding拷问一切，独立大模型赛道的两年生死（上篇）

2 个月前

AI资讯

63 阅读

大模型 AI 编程创业

100兆Token敲响警钟

2025年12月4日，OpenRouter与a16z联合发布的《The State of AI: An Empirical 100 Trillion Token Study with OpenRouter》报告，彻底击碎了行业对“超级应用”的集体幻想。报告显示，编程在付费模型Token使用量中的占比，从年初的11%飙升至11月的50%以上。这意味着，过去两年各家公司争抢的长文本心智、AI助手日活和投流获客成本，统统不是这场革命的真正引擎——Coding才是。

这份报告揭示了残酷的现实：中国头部大模型公司距离全球顶流尚有差距。在编程类API调用量中，一度占据超60%份额的是Anthropic的Claude，Coding主战场的全球第一梯队仍由美国闭源巨头主导。打开2025-2026年的主流Coding评测榜单——SWE-bench Verified、SWE-Bench Pro、Terminal Bench 2.0——中国名字反复出现：阿里巴巴的Qwen3-Coder接近70%，DeepSeek系列持续在榜，而独立大模型公司中，智谱GLM-5、Kimi K2.5、MiniMax M2.5同样位列其中。这证明了一件事：连年营收过万亿的互联网巨头都在全力押注Coding，独立公司若不在这个主战场占据位置，市值排位将直接面临降维打击。

四代创始人的入场棋局

2026年开年，智谱与MiniMax在港股先后敲钟，分别斩获1159.46倍和1837.17倍的认购纪录。月之暗面完成20亿美元D轮融资，估值突破200亿美元；阶跃星辰也即将完成近25亿美元融资，目标定价百亿美元区间。然而，四家公司市值差距巨大：智谱市值是MiniMax的两倍，月之暗面估值仅为智谱的三成多，阶跃星辰目标估值最低。这种差异背后，是四代创始人截然不同的决策风格。

Coding拷问一切，独立大模型赛道的两年生死（上篇）

学术派的长期主义：唐杰（智谱）：1977年出生的清华教授，从2022年押注通用大模型起，就坚持每一代基础模型对标GPT顶级闭源。这种“不合时宜”的坚持，让智谱在2026年2月发布GLM-5，拿下开源模型Coding历史最高分77.8分，随后GLM-5.1在SWE-Bench Pro上超越Claude Opus 4.6和GPT-5.4，登顶全球第一。
大厂派的迟到觉醒：闫俊杰（MiniMax）：1989年出生，前商汤副总裁。他选择了一条“反向押注”的路：C端原生、全模态并行、出海。Talkie全球下载量突破千万，2024年实现自负盈亏。但当Coding成为主战场，MiniMax的M2系列直到2025年10月才发布，比智谱晚了近一年。尽管M2.5在技术上追平第一梯队，但心智占位和市场认知的滞后导致市值折半。
天才少年的被迫转身：杨植麟（月之暗面）：1992年的卡内基梅隆博士，曾被媒体称为“中国AI最年轻的明星创业者”。DeepSeek-R1发布后，他从舆论场消失172天，最终用Kimi K2完成了从“超级应用”到“开源SOTA基础模型”的被迫转身。虽然估值从43亿美元飙升至200亿美元，但技术叙事几乎全系于他一人，单极风险成为市值进一步攀升的约束。
技术派的结构性妥协：姜大昕+印奇（阶跃星辰）：前微软全球副总裁与38岁的连续创业者组成双头结构。团队包括ResNet作者、IEEE Fellow、前字节Infra负责人，理论上应做出中国最强的基础大模型。但阶跃将资源分散到多模态、端侧、语音、视频等多个方向，导致在Coding评测榜单上几乎找不到Step系列模型。印奇加入后，阶跃转向“AI+终端”，在手机预装和车载Agent上取得进展，但这本质上是承认在通用基础大模型赛道上已掉队。

谁先看见Coding，谁就赢了

四家公司市值差异的背后，是它们各自押注Coding的时间先后、投入深度与决策风格的直接映射。

最先看见的唐杰：智谱从2022年起就默默做基础模型的长跑。2026年2月，GLM-5在SWE-bench Verified上拿下77.8分，一个月后GLM-5.1达到Claude Opus 4.6评分的94.6%。这些数字背后是四年的累积，唐杰的学术派逻辑——看长线、牺牲短期声量——最终让智谱成为市值最高的公司。
被迫清醒的杨植麟：Kimi K2被DeepSeek强迫转身后，在SWE-bench Verified上拿到65.8%，追上了第一梯队。但起步晚了智谱三年，代价是估值的相对落后。
迟到觉醒的闫俊杰：M2系列比Kimi K2晚了3个月，比智谱的Coding路线晚了将近一年。但MiniMax的C端出海业务提供了独立于Coding的价值底盘，使其市值（2500亿港元）反而高于转身更早的月之暗面（约1550亿港元）。这印证了：Coding决定上限，但基本盘决定下限。
没来得及的阶跃星辰：团队什么都想要，却什么都不是第一。Coding主战场的失位，让这一技术阵容最豪华的公司在2026年5月面临最低的目标估值。印奇的加入是一次外科手术式的纠正，但承认在通用基础大模型的核心战场上已追不上头部。

四种决策风格的代价与护城河

每一种决策风格都有其优势，也在2025-2026年付出了独有代价。

智谱的学院派代价：GLM-5因市场规模预估不准导致大量用户被限流，致歉信发布当天股价单日暴涨42.72%，市场对技术的认可远超对运营失误的不满。但当智谱不再是“开源Coding第一”时，运营天花板将变成估值天花板。另一个硬细节是：GLM-5全程在10万张华为昇腾910B芯片上训练，零英伟达GPU，这是一条被迫挖出的算力护城河。
月之暗面的单极风险：杨植麟是公司技术叙事的几乎全部承重墙。他的GTC演讲被马斯克评价为“令人印象深刻”，但行业内反复提及的脆弱性在于：一旦创始人出现任何变化，技术叙事会立刻失去重心。更深的挑战是商业模式的单薄——月之暗面是唯一没有大厂或金融集团现金奶牛支撑的独立创业公司。
MiniMax的大厂派滞后：闫俊杰在2026年3月的财报电话会上承认“多个模态融合是持续提升智能的前提”，但大厂派判断滞后于技术理想主义者半步到一步的代价，被资本市场放大成了50%的市值差距。2026年4月10日发布的《人工智能拟人化互动服务管理暂行办法》，对海螺、星野、Talkie的监管冲击，正在回收MiniMax基于2021年判断的C端红利。
阶跃星辰的博而不精：团队在基础大模型、多模态、Agent、语音、视频等多条线上均无绝对第一。印奇“AI+终端”的转向虽在4个月内显现成绩——手机预装突破4200万台、车载Agent量产——但这是一种妥协：承认在Coding主战场上已无法正面突破，只能寻找窄路。

Coding拷问一切，独立大模型赛道的两年生死（上篇）

100兆Token敲响警钟

四代创始人的入场棋局

谁先看见Coding，谁就赢了

四种决策风格的代价与护城河

链接失效反馈