大模型第一股交卷:3000亿市值和三个关键变量

背景:AI技术范式的剧烈变迁

自2022年底AI革命爆发以来,大模型行业经历了数轮洗牌与技术更迭。2024年,Kimi曾是炙手可热的明星项目,凭借200万字输入、高调推广策略获得10亿美元融资。但其实验性模型成本高昂、难以规模化,导致2025年中期陷入融资停滞与人才流失的困境。

与此同时,DeepSeek凭借扎实的技术积累,尤其是自研MLA(多头潜在注意力机制)和DeepSeekMoE架构,在2025年初崛起为技术标杆。其R1模型成功复现OpenAI o1的“深度思考”能力,并开源,推动整个行业进入技术驱动的新阶段。

转折:Kimi K2的开源策略与技术突破

2025年7月,Kimi发布K2模型,主打“Open Agentic Intelligence”理念,专注于Agent能力,尤其是编程与工具调用。这一策略被业内认为是对标Claude Code的尝试,迅速引起国际关注。

  • Nature杂志将其称为“另一个DeepSeek时刻”。
  • Anthropic联合创始人Jack Clark公开评价:Kimi编码和工具调用能力已足够实用,值得观察其采用率。
  • K2系列后续迭代如K2 Thinking和K2.5,在多模态理解、万亿参数规模上进一步突破。

这些技术进展不仅帮助Kimi恢复融资信心,也为其在2026年上市铺平道路。

大模型第一股交卷:3000亿市值和三个关键变量

上市表现:智谱成为“全球大模型第一股”

2026年1月8日,智谱在香港联合交易所正式挂牌上市,成为全球首个以大模型为核心资产的上市公司。其发行价为116.2港元/股,开盘即涨至120港元,盘中一度涨超10%,收盘上涨13.17%,报131.5港元,市值突破3000亿港元。

这一事件不仅代表资本市场对AI大模型商业化的认可,也标志着中国大模型企业开始在全球AI格局中占据一席之地。MiniMax紧随其后,两家公司市值双双突破3000亿港元。

关键变量:支撑大模型商业化的三大支柱

智谱与MiniMax的成功上市,背后有三个关键变量在支撑:

1. 技术突破与开源策略

  • Kimi K2、K2 Thinking、K2.5连续迭代,复现并超越Claude系列模型。
  • 通过开源技术赢得开发者社区信任,形成生态壁垒。
  • 技术影响力外溢,甚至影响全球AI创业方向,如Cursor采用Kimi K2.5作为基座模型。

2. 模型能效与优化能力

  • 深度优化模型推理与训练效率,提升单位算力下的产出能力。
  • Kimi采用Muon优化器,取代传统Adam,提升训练稳定性与效率。
  • DeepSeek V3通过MLA和MoE架构,在有限算力下实现极致性能。

3. 算力与需求的矛盾

  • Kimi方面透露,目前仍有10倍需求未满足,业务增长直接受限于算力。
  • 企业用户对Kimi模型的需求旺盛,甚至需要预购额度。
  • 算力资源成为核心竞争要素,技术与资源的协同愈发关键。

未来展望:中国公司能否成为全球AI领导者?

尽管Kimi与DeepSeek在技术与资本上取得阶段性突破,但AI革命才刚刚开始。2026年3月底,距离2022年底的爆发仅3年半时间,整个行业仍处于快速演进期。

  • Cursor丑闻表明,AI行业对真实技术能力的渴求远胜于包装。
  • Kimi与DeepSeek的路径差异也体现了中国公司在技术范式上的多样探索。
  • 随着Agent与多模态能力成为主流,中国大模型企业正逐步缩小与美国的差距。

正如一位行业观察者所言:为什么下一个OpenAI和Anthropic不能是一家中国公司?这场AI变革才刚刚展开,中国大模型企业已准备好在新范式中一争高下。