超越DeepSeek-V4!罗福莉交出小米最强开源模型,首日适配5家国产芯片
背景与发布情况
- 小米于2026年4月23日宣布推出MiMo-V2.5系列模型,包括旗舰推理模型MiMo-V2.5-Pro和全模态Agent模型MiMo-V2.5。
- 该系列模型由小米MiMo团队负责人罗福莉主导开发,她曾是DeepSeek的核心成员,被业界称为“天才少女”。
- MiMo-V2.5-Pro在发布后不久即宣布开源,并在首日完成了与多家国产芯片厂商的适配,包括阿里平头哥、百度昆仑芯等,显示出小米在模型开源与生态构建方面的快速响应能力。
MiMo-V2.5-Pro:专攻长难智能体任务的旗舰模型
- MiMo-V2.5-Pro是小米MiMo系列迄今为止最强大的模型,在通用智能体能力、复杂软件工程及长程任务处理上,能与Claude Opus 4.6、GPT-5.4等顶尖闭源模型媲美。
- 小米内部测试显示,该模型能稳定完成涉及近千轮工具调用的长程任务,在超长周期任务中保持逻辑一致性与指令遵循能力。
- 在北大《编译原理》课程项目中,MiMo-V2.5-Pro仅用4.3小时完成需本科生数周的工作,最终取得满分233分。
- 官方演示案例包括:
- 用Rust实现完整的SysY编译器;
- 开发具备多轨道时间线与导出功能的Web视频编辑器;
- 设计并优化FVF-LDO模拟电路,4项指标提升一个数量级。
MiMo-V2.5:全模态通用Agent模型,兼顾性能与时延
- MiMo-V2.5为原生全模态Agent模型,具备图像、音频、视频等多模态感知能力,适用于绝大多数通用Agent场景。
- 相较于MiMo-V2.5-Pro,MiMo-V2.5平均推理速度更快,更适合对时延敏感的任务。
- 在Claw-Eval、VideoMME、CharXiv、MMMU-Pro等评测中,MiMo-V2.5表现逼近甚至超越Gemini 3 Pro、GPT-5.4等闭源旗舰模型。
- 在日常编程任务中,MiMo-V2.5表现优于Gemini 3.1 Pro,但在复杂任务上仍略逊于Claude Opus 4.6。
开源生态与国产芯片适配
- MiMo-V2.5系列采用MIT协议开源,支持自由商用、二次训练与微调,无需额外授权。
- 首日即完成与多家主流推理芯片的适配,包括:
- 亚马逊云科技:基于Trainium2芯片与Neuron SDK+vLLM框架,实现全球可用部署,Trainium3将强化Agentic性能;
- AMD:通过ROCm开源软件栈提供Day-0级适配与优化;
- 百度昆仑芯:底层算子优化与软硬件协同加速,保障高效运行;
- 燧原科技:通过驭算TopsRider软件栈优化,MiMo-V2.5-Pro在L600芯片上实现高吞吐、低延迟;
- 天数智芯:完成Day 0级适配,支持模型快速迁移与高效部署。
- 这些适配表明MiMo-V2.5系列模型在国产芯片与开源生态中具备高度兼容性与部署便捷性。
Token Plan:计费简化+夜间折扣+连续订阅优惠
- 小米同步升级了其API调用套餐MiMo Token Plan,取消1 Token=4 Credits的复杂计费方式,统一Token消耗标准:
- MiMo-V2.5:1 Token = 1 Credit;
- MiMo-V2.5-Pro:1 Token = 2 Credits。
- 夜间专属优惠时段(00:00~08:00)所有模型消耗再打8折。
- 新增连续订阅模式:
- 包月自动续费:老用户次月7折,新用户次月77折;
- 包年订阅:全年88折,最高可减948.96元。
- 该优化回应了此前用户对“套餐贵、Token少”的抱怨,进一步推动模型普惠使用。
行业影响与未来展望
- 小米MiMo-V2.5系列的推出,标志着其在智能体大模型领域的技术突破,尤其在长程任务处理、多模态感知与高效代码生成方面。
- 开源首日即适配多家国产芯片,显示出小米在模型落地与国产化适配上的战略眼光,有望加速国产算力生态的发展。
- Token Plan的优化则降低了开发者和中小企业的使用门槛,有助于推动开源模型在实际业务中的广泛应用。
- 随着Trainium3、ROCm等新一代芯片与软件栈的加持,MiMo-V2.5-Pro的性能还将进一步释放,未来在Agent领域的竞争力将持续增强。