Coding拷问一切,独立大模型赛道的两年生死(上篇)

11 小时前
3 阅读

100兆Token敲响警钟

2025年12月4日,OpenRouter与a16z联合发布的《The State of AI: An Empirical 100 Trillion Token Study with OpenRouter》报告,彻底击碎了行业对“超级应用”的集体幻想。报告显示,编程在付费模型Token使用量中的占比,从年初的11%飙升至11月的50%以上。这意味着,过去两年各家公司争抢的长文本心智、AI助手日活和投流获客成本,统统不是这场革命的真正引擎——Coding才是。

这份报告揭示了残酷的现实:中国头部大模型公司距离全球顶流尚有差距。在编程类API调用量中,一度占据超60%份额的是Anthropic的Claude,Coding主战场的全球第一梯队仍由美国闭源巨头主导。打开2025-2026年的主流Coding评测榜单——SWE-bench Verified、SWE-Bench Pro、Terminal Bench 2.0——中国名字反复出现:阿里巴巴的Qwen3-Coder接近70%,DeepSeek系列持续在榜,而独立大模型公司中,智谱GLM-5、Kimi K2.5、MiniMax M2.5同样位列其中。这证明了一件事:连年营收过万亿的互联网巨头都在全力押注Coding,独立公司若不在这个主战场占据位置,市值排位将直接面临降维打击。

四代创始人的入场棋局

2026年开年,智谱与MiniMax在港股先后敲钟,分别斩获1159.46倍和1837.17倍的认购纪录。月之暗面完成20亿美元D轮融资,估值突破200亿美元;阶跃星辰也即将完成近25亿美元融资,目标定价百亿美元区间。然而,四家公司市值差距巨大:智谱市值是MiniMax的两倍,月之暗面估值仅为智谱的三成多,阶跃星辰目标估值最低。这种差异背后,是四代创始人截然不同的决策风格。

Coding拷问一切,独立大模型赛道的两年生死(上篇)

  • 学术派的长期主义:唐杰(智谱):1977年出生的清华教授,从2022年押注通用大模型起,就坚持每一代基础模型对标GPT顶级闭源。这种“不合时宜”的坚持,让智谱在2026年2月发布GLM-5,拿下开源模型Coding历史最高分77.8分,随后GLM-5.1在SWE-Bench Pro上超越Claude Opus 4.6和GPT-5.4,登顶全球第一。
  • 大厂派的迟到觉醒:闫俊杰(MiniMax):1989年出生,前商汤副总裁。他选择了一条“反向押注”的路:C端原生、全模态并行、出海。Talkie全球下载量突破千万,2024年实现自负盈亏。但当Coding成为主战场,MiniMax的M2系列直到2025年10月才发布,比智谱晚了近一年。尽管M2.5在技术上追平第一梯队,但心智占位和市场认知的滞后导致市值折半。
  • 天才少年的被迫转身:杨植麟(月之暗面):1992年的卡内基梅隆博士,曾被媒体称为“中国AI最年轻的明星创业者”。DeepSeek-R1发布后,他从舆论场消失172天,最终用Kimi K2完成了从“超级应用”到“开源SOTA基础模型”的被迫转身。虽然估值从43亿美元飙升至200亿美元,但技术叙事几乎全系于他一人,单极风险成为市值进一步攀升的约束。
  • 技术派的结构性妥协:姜大昕+印奇(阶跃星辰):前微软全球副总裁与38岁的连续创业者组成双头结构。团队包括ResNet作者、IEEE Fellow、前字节Infra负责人,理论上应做出中国最强的基础大模型。但阶跃将资源分散到多模态、端侧、语音、视频等多个方向,导致在Coding评测榜单上几乎找不到Step系列模型。印奇加入后,阶跃转向“AI+终端”,在手机预装和车载Agent上取得进展,但这本质上是承认在通用基础大模型赛道上已掉队。

谁先看见Coding,谁就赢了

四家公司市值差异的背后,是它们各自押注Coding的时间先后、投入深度与决策风格的直接映射。

  • 最先看见的唐杰:智谱从2022年起就默默做基础模型的长跑。2026年2月,GLM-5在SWE-bench Verified上拿下77.8分,一个月后GLM-5.1达到Claude Opus 4.6评分的94.6%。这些数字背后是四年的累积,唐杰的学术派逻辑——看长线、牺牲短期声量——最终让智谱成为市值最高的公司。
  • 被迫清醒的杨植麟:Kimi K2被DeepSeek强迫转身后,在SWE-bench Verified上拿到65.8%,追上了第一梯队。但起步晚了智谱三年,代价是估值的相对落后。
  • 迟到觉醒的闫俊杰:M2系列比Kimi K2晚了3个月,比智谱的Coding路线晚了将近一年。但MiniMax的C端出海业务提供了独立于Coding的价值底盘,使其市值(2500亿港元)反而高于转身更早的月之暗面(约1550亿港元)。这印证了:Coding决定上限,但基本盘决定下限。
  • 没来得及的阶跃星辰:团队什么都想要,却什么都不是第一。Coding主战场的失位,让这一技术阵容最豪华的公司在2026年5月面临最低的目标估值。印奇的加入是一次外科手术式的纠正,但承认在通用基础大模型的核心战场上已追不上头部。

四种决策风格的代价与护城河

每一种决策风格都有其优势,也在2025-2026年付出了独有代价。

  • 智谱的学院派代价:GLM-5因市场规模预估不准导致大量用户被限流,致歉信发布当天股价单日暴涨42.72%,市场对技术的认可远超对运营失误的不满。但当智谱不再是“开源Coding第一”时,运营天花板将变成估值天花板。另一个硬细节是:GLM-5全程在10万张华为昇腾910B芯片上训练,零英伟达GPU,这是一条被迫挖出的算力护城河。
  • 月之暗面的单极风险:杨植麟是公司技术叙事的几乎全部承重墙。他的GTC演讲被马斯克评价为“令人印象深刻”,但行业内反复提及的脆弱性在于:一旦创始人出现任何变化,技术叙事会立刻失去重心。更深的挑战是商业模式的单薄——月之暗面是唯一没有大厂或金融集团现金奶牛支撑的独立创业公司。
  • MiniMax的大厂派滞后:闫俊杰在2026年3月的财报电话会上承认“多个模态融合是持续提升智能的前提”,但大厂派判断滞后于技术理想主义者半步到一步的代价,被资本市场放大成了50%的市值差距。2026年4月10日发布的《人工智能拟人化互动服务管理暂行办法》,对海螺、星野、Talkie的监管冲击,正在回收MiniMax基于2021年判断的C端红利。
  • 阶跃星辰的博而不精:团队在基础大模型、多模态、Agent、语音、视频等多条线上均无绝对第一。印奇“AI+终端”的转向虽在4个月内显现成绩——手机预装突破4200万台、车载Agent量产——但这是一种妥协:承认在Coding主战场上已无法正面突破,只能寻找窄路。