小米MiMo要蹭着DeepSeek蹦上牌桌

1 个月前

AI资讯

28 阅读

DeepSeek AI大模型小米 MIMO

罗福莉带队突袭，MiMo-V2.5深夜发布直击DeepSeek命门

4月23日，小米MiMo大模型一口气官宣四款新模型：旗舰推理模型MiMo-V2.5-Pro、全模态Agent模型MiMo-V2.5等，带队研发的正是原DeepSeek核心成员、被誉为“天才少女”的罗福莉。距离上一代MiMo-V2系列仅36天，此次发布正值DeepSeek V4被传将于本周发布，小米选择此时“深夜突袭”，直接将矛头对准了DeepSeek的腹地。与上一代类似，MiMo-V2.5全系列专为智能体场景打造，Pro版专攻长难Agent任务，普通版则覆盖绝大多数通用Agent场景。

基准测试全面碾压：MiMo-V2.5-Pro排名第一，DeepSeek V4-Pro沦为背景板

小米公布的评测结果显示，MiMo-V2.5-Pro在GDPVal-AA（Elo）、Claw-Eval（Pass^3）等多项基准测试中，超越了DeepSeek最新开源的DeepSeek-V4-Pro，也优于刚发布的Kimi K2.6等主流闭源模型，总体排名第一。MiMo-V2.5则在Claw-Eval Text、Terminal-Bench 2.0、SWE-Bench Pro等软件工程及代理任务评测中，大幅领先DeepSeek-V4-Flash。在实际测试中，MiMo-V2.5-Pro用4.3小时完成了北大编译原理课程项目（本科生通常需数周），11.5小时自主构建出具备多轨道时间线、音频混合等功能的视频编辑器Web应用（8192行代码，1868次工具调用）。值得注意的是，今年3月MiMo-V2-Pro曾以匿名模型“Hunter Alpha”现身OpenRouter，一度被开发者误认为是即将发布的DeepSeek V4——如今小米直接“亮剑”，从模仿者变为超越者。

开箱即用：Day 0适配七大芯片，与阿里、亚马逊、AMD等全面打通

开源首日，MiMo-V2.5-Pro即宣布完成与阿里巴巴平头哥、亚马逊AWS（基于Trainium2芯片）、AMD（ROCm开源软件栈）、百度昆仑芯、燧原科技、沐曦、天数智芯共七家芯片厂商的接入适配，同步完成SGLang与vLLM两大主流推理框架的Day 0适配。这意味着用户拿到模型即可直接部署，无需等待适配周期。业內人士指出，“Day 0”芯片适配已从加分项演变为上架门槛，小米此举直接降低了合作伙伴的落地成本。模型本身采用MIT授权协议，允许商业推理部署与二次训练，无需额外授权——这对企业用户极具吸引力。

100兆Token免费派送，生态激励加码：从拼参数转向拼应用落地

小米同步推出“MiMo Orbit计划”，包含两大方向：一是面向全球AI用户的百兆Token创造者激励计划，于2026年4月28日至5月28日期间免费发放共100兆Token权益，通过审核者最高可获价值659元的Max档位Token Plan；二是面向全球代理框架团队的代理生态共建计划，提供Token免费支持，并共同举办AI Hackathon等活动，目前已与OpenCode、Hermes Agent、KiloCode等框架厂商展开深度合作。同时，小米全面优化了Token Plan计费模式：取消4倍Credits计费、不再区分256k和1M上下文、夜间00:00-08:00所有模型Credits消耗8折、连续包月与包年订阅上线（包年至高省948元）。罗福莉的策略很清晰：用高性价比的API和免费Token吸引开发者，快速构建应用生态，让MiMo不再是“实验室模型”。

拼应用落地，小米AI加速“人车家”全场景布局

MiMo-V2.5-Pro采用混合专家架构（MoE），总参数1.02T，启动参数42B，支持最长100万Token上下文，Token效率相比前代大幅提升（在ClawEval相同分数下比Kimi K2.6节省42% Token，比Meta Muse Spark节省50% Token）。更关键的是，模型专为系统级智能体设计——MiMo-V2.5支持原生全模态Agent能力（图像、音频、视频），能看、能听、能读并自动采取行动。这背后是小米作为终端硬件厂商的独特优势：将自研底层大模型、系统级权限、全生态服务（手机、汽车、智能家居）深度绑定融合，打造真正意义上的系统级原生智能体。随着MiMo-V2.5系列的发布，国产大模型的开源竞争已从“拼参数”正式进入“拼应用落地”阶段，而小米正试图用罗福莉这张牌，在牌桌上占据一席之地。