首页

登录

超越DeepSeek-V4！罗福莉交出小米最强开源模型，首日适配5家国产芯片

3 个月前

AI资讯

42 阅读

罗福莉 [开源模型国产芯片适配小米AI]

背景与发布情况

小米于2026年4月23日宣布推出MiMo-V2.5系列模型，包括旗舰推理模型MiMo-V2.5-Pro和全模态Agent模型MiMo-V2.5。
该系列模型由小米MiMo团队负责人罗福莉主导开发，她曾是DeepSeek的核心成员，被业界称为“天才少女”。
MiMo-V2.5-Pro在发布后不久即宣布开源，并在首日完成了与多家国产芯片厂商的适配，包括阿里平头哥、百度昆仑芯等，显示出小米在模型开源与生态构建方面的快速响应能力。

MiMo-V2.5-Pro：专攻长难智能体任务的旗舰模型

MiMo-V2.5-Pro是小米MiMo系列迄今为止最强大的模型，在通用智能体能力、复杂软件工程及长程任务处理上，能与Claude Opus 4.6、GPT-5.4等顶尖闭源模型媲美。
小米内部测试显示，该模型能稳定完成涉及近千轮工具调用的长程任务，在超长周期任务中保持逻辑一致性与指令遵循能力。
在北大《编译原理》课程项目中，MiMo-V2.5-Pro仅用4.3小时完成需本科生数周的工作，最终取得满分233分。
官方演示案例包括：
- 用Rust实现完整的SysY编译器；
- 开发具备多轨道时间线与导出功能的Web视频编辑器；
- 设计并优化FVF-LDO模拟电路，4项指标提升一个数量级。

MiMo-V2.5：全模态通用Agent模型，兼顾性能与时延

MiMo-V2.5为原生全模态Agent模型，具备图像、音频、视频等多模态感知能力，适用于绝大多数通用Agent场景。
相较于MiMo-V2.5-Pro，MiMo-V2.5平均推理速度更快，更适合对时延敏感的任务。
在Claw-Eval、VideoMME、CharXiv、MMMU-Pro等评测中，MiMo-V2.5表现逼近甚至超越Gemini 3 Pro、GPT-5.4等闭源旗舰模型。
在日常编程任务中，MiMo-V2.5表现优于Gemini 3.1 Pro，但在复杂任务上仍略逊于Claude Opus 4.6。

开源生态与国产芯片适配

MiMo-V2.5系列采用MIT协议开源，支持自由商用、二次训练与微调，无需额外授权。
首日即完成与多家主流推理芯片的适配，包括：
- 亚马逊云科技：基于Trainium2芯片与Neuron SDK+vLLM框架，实现全球可用部署，Trainium3将强化Agentic性能；
- AMD：通过ROCm开源软件栈提供Day-0级适配与优化；
- 百度昆仑芯：底层算子优化与软硬件协同加速，保障高效运行；
- 燧原科技：通过驭算TopsRider软件栈优化，MiMo-V2.5-Pro在L600芯片上实现高吞吐、低延迟；
- 天数智芯：完成Day 0级适配，支持模型快速迁移与高效部署。
这些适配表明MiMo-V2.5系列模型在国产芯片与开源生态中具备高度兼容性与部署便捷性。

Token Plan：计费简化+夜间折扣+连续订阅优惠

小米同步升级了其API调用套餐MiMo Token Plan，取消1 Token=4 Credits的复杂计费方式，统一Token消耗标准：
- MiMo-V2.5：1 Token = 1 Credit；
- MiMo-V2.5-Pro：1 Token = 2 Credits。
夜间专属优惠时段（00:00~08:00）所有模型消耗再打8折。
新增连续订阅模式：
- 包月自动续费：老用户次月7折，新用户次月77折；
- 包年订阅：全年88折，最高可减948.96元。
该优化回应了此前用户对“套餐贵、Token少”的抱怨，进一步推动模型普惠使用。

行业影响与未来展望

小米MiMo-V2.5系列的推出，标志着其在智能体大模型领域的技术突破，尤其在长程任务处理、多模态感知与高效代码生成方面。
开源首日即适配多家国产芯片，显示出小米在模型落地与国产化适配上的战略眼光，有望加速国产算力生态的发展。
Token Plan的优化则降低了开发者和中小企业的使用门槛，有助于推动开源模型在实际业务中的广泛应用。
随着Trainium3、ROCm等新一代芯片与软件栈的加持，MiMo-V2.5-Pro的性能还将进一步释放，未来在Agent领域的竞争力将持续增强。