国产通用大模型第一梯队,来新人了?!
“基模五强”接棒“六小虎”:新格局下的入场券争夺战
2025年之前的“大模型六小虎”格局已被彻底打破。随着DeepSeek以“GPT-4级别性能+十分之一算力成本”的颠覆性突破,外加字节、阿里等巨头重资杀回,市场加速收敛至全新的“基模五强”:字节跳动、阿里、阶跃星辰、智谱AI和DeepSeek。这一洗牌意味着资源、人才与资本正疯狂向头部集中。曾经的“六小虎”中的MiniMax、百川智能、月之暗面等虽仍在各维度保有优势,但在通用赛道的第一梯队争夺中已暂时掉队。新五强的共同特征是:要么背靠金主自研实力雄厚(字节、阿里、DeepSeek),要么拿到了地方国资和产业资本的重注(阶跃星辰、智谱),并在多模态、开源或Agent等关键方向握有不可替代的牌。

阶跃星辰:上海滩跑出的“多模态卷王”
在所有新面孔中,阶跃星辰是崛起最快的一匹黑马。这家成立于2023年4月的公司,仅用两年时间便自主研发了22款基座模型,其中16款为多模态模型,被业界称为“多模态卷王”。其Step-1o Vision在Chatbot Arena视觉领域拿下中国第一,多模态矩阵覆盖文字、语音、图像、视频、音乐、推理,且每个模态均达到第一梯队。阶跃星辰的核心投资方包括上海国有资本投资有限公司,被视作“国家队”成员。团队方面更是集齐了“梦之队”——创始人姜大昕曾任微软全球副总裁,首席科学家张祥雨是ResNet论文作者,其论文引用量超25万次。这种技术底蕴使其在B轮融资后依然保持80%以上的研发人员占比,并与吉利、OPPO、智元机器人等头部企业建立了Agent与智能终端深度合作。
DeepSeek:用极致工程化改写了游戏规则
DeepSeek的入场方式堪称“核弹级”——它让全球AI界意识到:砸钱堆卡不是通向AGI的唯一路径。DeepSeek-R1以OpenAI几十分之一的成本实现了接近GPT-4的性能,其MoE架构(671B参数仅激活37B)、多Token预测(MTP)和多头潜注意力(MLA)等系统性创新,彻底颠覆了大模型训练的成本结构。凭借研究导向而非短期盈利驱动,DeepSeek在GitHub上获得了全球开发者追捧,并且催生了硅谷的“DeepSeek恐慌”。不过,其短板在于缺少一个抖音或淘宝级别的超级应用作为生态承载,目前主要依靠开源社区和口碑传播。但无论如何,DeepSeek已经凭实力挤进了第一梯队,成为“中国AI技术硬实力”的象征性存在。
字节与阿里:守成者的防御与新贵的进攻
字节与阿里虽未被“换掉”,但也在新人冲击下加速进化。字节以“巨型航母重回创业”姿态,由张一鸣亲自带队,挖来Google Fellow吴永辉负责基础研究,豆包App月活破3亿稳住用户规模第一。阿里则以“开源王者”姿态全球吸粉,千问(Qwen)系列在Hugging Face的衍生模型超10万个,并宣布未来三年投入3800亿元用于AI基础设施。两者的共同策略是将大模型嵌入现有流量生态(抖音、淘宝、支付宝),实现“无感AI”。而新人阶跃星辰和DeepSeek则在多模态深度与成本效率上不断向巨头施压,推动整个第一梯队的技术竞赛从“参数比拼”转向“智能上限和多模态融合”的决赛阶段。这场“新人入局”的戏码,正在将国产大模型的竞争带入更惨烈也更有想象力的下半场。