小米MiMo要蹭着DeepSeek蹦上牌桌

罗福莉带队突袭,MiMo-V2.5深夜发布直击DeepSeek命门

4月23日,小米MiMo大模型一口气官宣四款新模型:旗舰推理模型MiMo-V2.5-Pro、全模态Agent模型MiMo-V2.5等,带队研发的正是原DeepSeek核心成员、被誉为“天才少女”的罗福莉。距离上一代MiMo-V2系列仅36天,此次发布正值DeepSeek V4被传将于本周发布,小米选择此时“深夜突袭”,直接将矛头对准了DeepSeek的腹地。与上一代类似,MiMo-V2.5全系列专为智能体场景打造,Pro版专攻长难Agent任务,普通版则覆盖绝大多数通用Agent场景。

基准测试全面碾压:MiMo-V2.5-Pro排名第一,DeepSeek V4-Pro沦为背景板

小米公布的评测结果显示,MiMo-V2.5-Pro在GDPVal-AA(Elo)、Claw-Eval(Pass^3)等多项基准测试中,超越了DeepSeek最新开源的DeepSeek-V4-Pro,也优于刚发布的Kimi K2.6等主流闭源模型,总体排名第一。MiMo-V2.5则在Claw-Eval Text、Terminal-Bench 2.0、SWE-Bench Pro等软件工程及代理任务评测中,大幅领先DeepSeek-V4-Flash。在实际测试中,MiMo-V2.5-Pro用4.3小时完成了北大编译原理课程项目(本科生通常需数周),11.5小时自主构建出具备多轨道时间线、音频混合等功能的视频编辑器Web应用(8192行代码,1868次工具调用)。值得注意的是,今年3月MiMo-V2-Pro曾以匿名模型“Hunter Alpha”现身OpenRouter,一度被开发者误认为是即将发布的DeepSeek V4——如今小米直接“亮剑”,从模仿者变为超越者。

开箱即用:Day 0适配七大芯片,与阿里、亚马逊、AMD等全面打通

开源首日,MiMo-V2.5-Pro即宣布完成与阿里巴巴平头哥、亚马逊AWS(基于Trainium2芯片)、AMD(ROCm开源软件栈)、百度昆仑芯、燧原科技、沐曦、天数智芯共七家芯片厂商的接入适配,同步完成SGLang与vLLM两大主流推理框架的Day 0适配。这意味着用户拿到模型即可直接部署,无需等待适配周期。业內人士指出,“Day 0”芯片适配已从加分项演变为上架门槛,小米此举直接降低了合作伙伴的落地成本。模型本身采用MIT授权协议,允许商业推理部署与二次训练,无需额外授权——这对企业用户极具吸引力。

100兆Token免费派送,生态激励加码:从拼参数转向拼应用落地

小米同步推出“MiMo Orbit计划”,包含两大方向:一是面向全球AI用户的百兆Token创造者激励计划,于2026年4月28日至5月28日期间免费发放共100兆Token权益,通过审核者最高可获价值659元的Max档位Token Plan;二是面向全球代理框架团队的代理生态共建计划,提供Token免费支持,并共同举办AI Hackathon等活动,目前已与OpenCode、Hermes Agent、KiloCode等框架厂商展开深度合作。同时,小米全面优化了Token Plan计费模式:取消4倍Credits计费、不再区分256k和1M上下文、夜间00:00-08:00所有模型Credits消耗8折、连续包月与包年订阅上线(包年至高省948元)。罗福莉的策略很清晰:用高性价比的API和免费Token吸引开发者,快速构建应用生态,让MiMo不再是“实验室模型”。

拼应用落地,小米AI加速“人车家”全场景布局

MiMo-V2.5-Pro采用混合专家架构(MoE),总参数1.02T,启动参数42B,支持最长100万Token上下文,Token效率相比前代大幅提升(在ClawEval相同分数下比Kimi K2.6节省42% Token,比Meta Muse Spark节省50% Token)。更关键的是,模型专为系统级智能体设计——MiMo-V2.5支持原生全模态Agent能力(图像、音频、视频),能看、能听、能读并自动采取行动。这背后是小米作为终端硬件厂商的独特优势:将自研底层大模型、系统级权限、全生态服务(手机、汽车、智能家居)深度绑定融合,打造真正意义上的系统级原生智能体。随着MiMo-V2.5系列的发布,国产大模型的开源竞争已从“拼参数”正式进入“拼应用落地”阶段,而小米正试图用罗福莉这张牌,在牌桌上占据一席之地。