雷军宣布小米大模型达成新里程碑:MiMo 调用量超 1 万亿 Token
背景:小米AI战略加速推进
近年来,小米在AI领域持续加码,从语音识别、图像处理到大模型研发,逐步构建起全面的AI技术体系。随着全球大模型竞争加剧,小米在2025年启动“压强式投入”战略,明确将AI作为未来发展的核心方向。同年12月,小米首次开源AI大模型MiMo-V2-Flash,获得开发者社区广泛关注。
进入2026年后,小米加速布局大模型生态。3月19日,小米正式发布三款自研大模型:MiMo-V2-Pro、MiMo-V2-Omni与MiMo-V2-TTS,涵盖文本、视觉、语音等多模态能力,全面覆盖从感知到表达的AI应用场景。
MiMo-V2-Pro 技术突破与性能表现
MiMo-V2-Pro 是小米此次发布的旗舰文本基座模型,总参数量超过1万亿(1T),激活参数为420亿,采用改进后的混合注意力机制(Hybrid Attention),兼顾模型容量与推理效率。其上下文窗口扩展至100万Token,支持处理复杂任务链与长文本对话,成为当前大模型市场中的T0级别产品。

该模型专为Agent高强度应用场景优化,具备强大的逻辑推理、任务规划与工具调用能力。据权威评测平台Artificial Analysis榜单显示,MiMo-V2-Pro位列全球第五,在全球大模型品牌中排名第五。其无幻觉表现比例达到70%,在全球范围内仅次于Grok 4.2和Claude 4.5 Haiku。
在3月11日以“Hunter Alpha”为代号上线OpenRouter后,MiMo-V2-Pro累计调用量仅七天就突破1万亿Token,周榜排名第一,成为该平台史上首个周Token消耗超3万亿的模型,市占率超过30%。
生态布局与商业化路径
小米大模型团队与OpenClaw、OpenCode、KiloCode、Blackbox及Cline五大Agent框架合作,提供限时免费接口支持,进一步推动MiMo系列在开发者社区的普及。目前,MiMo-V2系列已登陆Xiaomi miclaw、MiMo Studio、金山办公、小米浏览器等多个平台,开发者与用户可通过API接入使用。
MiMo-V2-Pro API定价极具竞争力:256K上下文以内,输入每百万Token仅1美元,输出3美元;1M上下文则为输入2美元,输出6美元。MiMo-V2-Omni也已开放API服务,支持256K上下文长度,输入与输出分别为0.4美元和2美元,展现了小米以价格优势占领市场的决心。
小米还发布了MiMo-V2-TTS语音合成大模型,具备高拟真度和情感表达能力,支持唱歌、音色克隆等功能,标志着小米在多模态智能体的表达能力上实现了闭环。
行业影响与未来展望
MiMo-V2-Pro的出色表现引发了行业广泛关注。其在多轮对话、复杂逻辑推理及指令遵循方面的稳定性,被开发者誉为“人生导师”,甚至被认为可媲美DeepSeek-V3.2等国际一线模型。由于响应速度快、输出精准,MiMo已成为OpenRouter平台上的“明星模型”。
小米大模型负责人罗福莉作为“AI才女”,在业界积累了深厚技术背景。她曾参与阿里VECO、AliceMind等项目,并在DeepSeek任职期间参与研发DeepSeek-V2,此次领导MiMo团队实现技术突破,也被视为小米AI战略的关键推动力。
雷军表示,小米将在2026年持续加码AI投入,全年研发与资本支出将超过160亿元。随着小米“人车家全生态”战略的深化,MiMo系列将在智能终端、车载助手、家庭交互等场景中发挥更大作用,推动AI与物理世界的深度融合。
未来,小米将继续以Agent为核心方向,持续迭代MiMo系列模型,提升多模态处理与智能决策能力,构建更具人性化的AI服务生态。