国产通用大模型第一梯队，来新人了？！

1 个月前

AI资讯

25 阅读

AI竞争 [大模型行业洗牌]国产

“基模五强”接棒“六小虎”：新格局下的入场券争夺战

2025年之前的“大模型六小虎”格局已被彻底打破。随着DeepSeek以“GPT-4级别性能+十分之一算力成本”的颠覆性突破，外加字节、阿里等巨头重资杀回，市场加速收敛至全新的“基模五强”：字节跳动、阿里、阶跃星辰、智谱AI和DeepSeek。这一洗牌意味着资源、人才与资本正疯狂向头部集中。曾经的“六小虎”中的MiniMax、百川智能、月之暗面等虽仍在各维度保有优势，但在通用赛道的第一梯队争夺中已暂时掉队。新五强的共同特征是：要么背靠金主自研实力雄厚（字节、阿里、DeepSeek），要么拿到了地方国资和产业资本的重注（阶跃星辰、智谱），并在多模态、开源或Agent等关键方向握有不可替代的牌。

国产通用大模型第一梯队，来新人了？！

阶跃星辰：上海滩跑出的“多模态卷王”

在所有新面孔中，阶跃星辰是崛起最快的一匹黑马。这家成立于2023年4月的公司，仅用两年时间便自主研发了22款基座模型，其中16款为多模态模型，被业界称为“多模态卷王”。其Step-1o Vision在Chatbot Arena视觉领域拿下中国第一，多模态矩阵覆盖文字、语音、图像、视频、音乐、推理，且每个模态均达到第一梯队。阶跃星辰的核心投资方包括上海国有资本投资有限公司，被视作“国家队”成员。团队方面更是集齐了“梦之队”——创始人姜大昕曾任微软全球副总裁，首席科学家张祥雨是ResNet论文作者，其论文引用量超25万次。这种技术底蕴使其在B轮融资后依然保持80%以上的研发人员占比，并与吉利、OPPO、智元机器人等头部企业建立了Agent与智能终端深度合作。

DeepSeek：用极致工程化改写了游戏规则

DeepSeek的入场方式堪称“核弹级”——它让全球AI界意识到：砸钱堆卡不是通向AGI的唯一路径。DeepSeek-R1以OpenAI几十分之一的成本实现了接近GPT-4的性能，其MoE架构（671B参数仅激活37B）、多Token预测（MTP）和多头潜注意力（MLA）等系统性创新，彻底颠覆了大模型训练的成本结构。凭借研究导向而非短期盈利驱动，DeepSeek在GitHub上获得了全球开发者追捧，并且催生了硅谷的“DeepSeek恐慌”。不过，其短板在于缺少一个抖音或淘宝级别的超级应用作为生态承载，目前主要依靠开源社区和口碑传播。但无论如何，DeepSeek已经凭实力挤进了第一梯队，成为“中国AI技术硬实力”的象征性存在。

字节与阿里：守成者的防御与新贵的进攻

字节与阿里虽未被“换掉”，但也在新人冲击下加速进化。字节以“巨型航母重回创业”姿态，由张一鸣亲自带队，挖来Google Fellow吴永辉负责基础研究，豆包App月活破3亿稳住用户规模第一。阿里则以“开源王者”姿态全球吸粉，千问（Qwen）系列在Hugging Face的衍生模型超10万个，并宣布未来三年投入3800亿元用于AI基础设施。两者的共同策略是将大模型嵌入现有流量生态（抖音、淘宝、支付宝），实现“无感AI”。而新人阶跃星辰和DeepSeek则在多模态深度与成本效率上不断向巨头施压，推动整个第一梯队的技术竞赛从“参数比拼”转向“智能上限和多模态融合”的决赛阶段。这场“新人入局”的戏码，正在将国产大模型的竞争带入更惨烈也更有想象力的下半场。

国产通用大模型第一梯队，来新人了？！

“基模五强”接棒“六小虎”：新格局下的入场券争夺战

阶跃星辰：上海滩跑出的“多模态卷王”

DeepSeek：用极致工程化改写了游戏规则

字节与阿里：守成者的防御与新贵的进攻

链接失效反馈