雷军：3倍价格10倍速度！小米万亿参数模型1000 tokens/s狂飙，只需8张GPU

1 个月前

AI资讯

27 阅读

大模型 AI 小米雷军

MiMo调用量破万亿，雷军官宣新里程碑

4月3日，小米创始人雷军在微博宣布，其自研大模型MiMo单日调用量正式突破1万亿Token。雷军称这是小米在大模型领域“一个新的里程碑”。截至目前，小米MiMo系列模型已支撑包括旗舰手机、智能汽车、IoT设备在内的全场景AI能力，成为其“人车家全生态”战略的核心引擎。

雷军：3倍价格10倍速度！小米万亿参数模型1000 tokens/s狂飙，只需8张GPU

参数翻3倍！MiMo-V2-Pro跻身全球前五

3月19日，小米一口气发布三款自研大模型：旗舰文本基座MiMo-V2-Pro、全模态基座MiMo-V2-Omni和语音合成模型MiMo-V2-TTS。其中MiMo-V2-Pro总参数量突破1T（激活参数42B），较前代MiMo-V2-Flash扩大约3倍。该模型采用改进后的Hybrid Attention机制，混合比例提升至7:1，支持100万Token超长上下文，专为高强度的Agent工作场景优化。在Text Arena权威评测中，MiMo-V2-Pro凭借复杂逻辑推理和长指令遵循能力，Model Rank冲进全球前五，仅次于Anthropic、OpenAI、Google；在LabRank维度，小米排名全球第四。更关键的是，该模型在OpenRouter全球API调用量排行榜上连续多日登顶日榜、周榜和趋势榜第一，上周Token消耗量突破4万亿，超越Claude、千问、Gemini等主流模型。

月费39元起，小米推出“养龙虾”套餐

同步上线的还有面向开发者的订阅式API套餐“MiMo Token Plan”，分为四档：Lite（39元/月，6000万Credits）、Standard（99元/月，2亿Credits）、Pro（329元/月，7亿Credits）、Max（659元/月，16亿Credits），首次购买享88折优惠。套餐支持MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS三款模型，兼容OpenCode、Claude Code等主流工具链。需要注意的是，套餐到期后未使用额度不结转，不支持降级，但允许补差额升级。不少开发者反馈“便宜的套餐不够用”，有人前两周消耗近4亿Token，对比腾讯QClaw每日免费额度，认为小米套餐定价偏高。不过，该套餐取消了5小时token使用限额，允许开发者高强度集中调用，被戏称为“养龙虾”套餐。

从“Hunter Alpha”到全模态，小米全面押注Agent时代

早在3月11日，代号“Hunter Alpha”的神秘模型在OpenRouter上线，短时间累计调用量破万亿，一度被误认为是DeepSeek V4的早期版本。事后证实，这正是MiMo-V2-Pro的内部测试版。模型背后的关键人物是小米大模型负责人罗福莉（95后“AI才女”），她曾任职阿里达摩院和DeepSeek，主导开发了多语言预训练模型VECO。小米总裁卢伟冰此前透露，小米在AI领域已启动“压强式投入”，2026年研发和资本投入将超160亿元。随着MiMo-V2-Pro、MiMo-V2-Omni和MiMo-V2-TTS三款模型全面开放API，小米正从单一文本模型向全模态、全链路的Agent基座演进，未来将聚焦“AI与物理世界的深度结合”。

雷军：3倍价格10倍速度！小米万亿参数模型1000 tokens/s狂飙，只需8张GPU

MiMo调用量破万亿，雷军官宣新里程碑

参数翻3倍！MiMo-V2-Pro跻身全球前五

月费39元起，小米推出“养龙虾”套餐

从“Hunter Alpha”到全模态，小米全面押注Agent时代

链接失效反馈