雷军:3倍价格10倍速度!小米万亿参数模型1000 tokens/s狂飙,只需8张GPU
MiMo调用量破万亿,雷军官宣新里程碑
4月3日,小米创始人雷军在微博宣布,其自研大模型MiMo单日调用量正式突破1万亿Token。雷军称这是小米在大模型领域“一个新的里程碑”。截至目前,小米MiMo系列模型已支撑包括旗舰手机、智能汽车、IoT设备在内的全场景AI能力,成为其“人车家全生态”战略的核心引擎。

参数翻3倍!MiMo-V2-Pro跻身全球前五
3月19日,小米一口气发布三款自研大模型:旗舰文本基座MiMo-V2-Pro、全模态基座MiMo-V2-Omni和语音合成模型MiMo-V2-TTS。其中MiMo-V2-Pro总参数量突破1T(激活参数42B),较前代MiMo-V2-Flash扩大约3倍。该模型采用改进后的Hybrid Attention机制,混合比例提升至7:1,支持100万Token超长上下文,专为高强度的Agent工作场景优化。在Text Arena权威评测中,MiMo-V2-Pro凭借复杂逻辑推理和长指令遵循能力,Model Rank冲进全球前五,仅次于Anthropic、OpenAI、Google;在LabRank维度,小米排名全球第四。更关键的是,该模型在OpenRouter全球API调用量排行榜上连续多日登顶日榜、周榜和趋势榜第一,上周Token消耗量突破4万亿,超越Claude、千问、Gemini等主流模型。
月费39元起,小米推出“养龙虾”套餐
同步上线的还有面向开发者的订阅式API套餐“MiMo Token Plan”,分为四档:Lite(39元/月,6000万Credits)、Standard(99元/月,2亿Credits)、Pro(329元/月,7亿Credits)、Max(659元/月,16亿Credits),首次购买享88折优惠。套餐支持MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS三款模型,兼容OpenCode、Claude Code等主流工具链。需要注意的是,套餐到期后未使用额度不结转,不支持降级,但允许补差额升级。不少开发者反馈“便宜的套餐不够用”,有人前两周消耗近4亿Token,对比腾讯QClaw每日免费额度,认为小米套餐定价偏高。不过,该套餐取消了5小时token使用限额,允许开发者高强度集中调用,被戏称为“养龙虾”套餐。
从“Hunter Alpha”到全模态,小米全面押注Agent时代
早在3月11日,代号“Hunter Alpha”的神秘模型在OpenRouter上线,短时间累计调用量破万亿,一度被误认为是DeepSeek V4的早期版本。事后证实,这正是MiMo-V2-Pro的内部测试版。模型背后的关键人物是小米大模型负责人罗福莉(95后“AI才女”),她曾任职阿里达摩院和DeepSeek,主导开发了多语言预训练模型VECO。小米总裁卢伟冰此前透露,小米在AI领域已启动“压强式投入”,2026年研发和资本投入将超160亿元。随着MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS三款模型全面开放API,小米正从单一文本模型向全模态、全链路的Agent基座演进,未来将聚焦“AI与物理世界的深度结合”。