为什么阶跃星辰获得了第二次机会

LiveBench称霸,Step-2指令遵从力压GPT-o1

图灵奖得主杨立昆联合推出的LiveBench被誉为“不可玩弄的LLM基准测试”,采用每月更新的新鲜数据严防刷榜。正是在这一严苛榜单中,阶跃星辰万亿参数MoE模型Step-2以86.57分的IF Average(指令遵从)平均分夺得第一,超越Gemini-1.5-flash(84.55)和以推理著称的o1-preview(77.72)。Step-2从2024年3月发布预览版到WAIC正式版仅用四个月便全面逼近GPT-4,又用四个月完成对Gemini-1.5和GPT-o1部分能力的反超。这背后是阶跃团队坚持从零训练MoE架构而非upcycle的策略,使得每次激活参数量远超同类Dense模型,在语义理解与指令跟随上具备天然优势。

最新开源模型登顶MathArena,11B参数比肩GPT-5.2

2026年2月,阶跃开源Agent基座模型Step 3.5 Flash,凭借仅11B激活参数在AIME 2025(97.3分)、HMMT 2025(96.2分)等数学竞赛中拿下国内开源模型第一。更关键的是,在MathArena总体榜单上,Step 3.5 Flash以96.11%的准确率几乎与GPT-5.2(96.29%)持平,且推理成本显著更低。其最快推理速度达每秒350 token,发布当天即登上OpenRouter最快模型榜单,两天后登顶趋势榜。这一系列技术检验证明阶跃不仅有万亿参数的大模型能力,更有高效、可部署的小模型实力。

印奇挂帅与50亿融资:商业拼图的关键落子

2026年1月,阶跃星辰完成超50亿元B+轮融资,刷新过去12个月国内AI赛道单笔最高纪录,出资方包括多地国资与产业投资人,腾讯、启明、五源等老股东跟投。同期,旷视科技创始人印奇正式出任阶跃星辰董事长,与CEO姜大昕、首席科学家张祥雨、CTO朱亦博形成“1+3”核心班底。印奇曾带领旷视在AI1.0时代完成商业化探索,如今将负责公司顶层战略、资本运作及终端落地;CEO姜大昕继续主导技术研发。这种“技术+商业化”双轮驱动的组织架构,与大模型公司智谱、月之暗面的模式一脉相承,为阶跃提供了冲击IPO前的价值确证。

从C端收缩到AI+终端:押注原生多模态与端侧Agent

面对DeepSeek带来的低成本冲击,阶跃星辰主动放弃角色陪伴产品“冒泡鸭”,将资源集中到对话助手“阶跃AI”并转向Agent。同时,公司从一开始就坚持“原生多模态”路线,累计发布22款自研基座模型,其中16款为多模态模型。截至2026年初,阶跃多模态技术已落地OPPO、荣耀等旗舰机型,装机量超4200万台,日均服务近2000万人次。其与千里科技、吉利联合发布的AgentOS智能座舱已搭载于量产车型银河M9,上市3个月销量近4万,预计2026年“上车”规模超百万辆。这种端云结合、聚焦终端部署的战略,使阶跃在“AI+终端”的风口中抢得先机。