MiniMax M3 模型正式开源:原生多模态、百万上下文
MiniMax 稀宇科技于今日正式发布 M3 大模型,在编码、多模态理解和超长上下文处理三大领域实现技术突破。基于自研 MiniMax Sparse Attention(MSA)架构,M3 的 API 最高支持 1M tokens 上下文窗口,并保障至少 512K tokens 的稳定可用性。在多项权威评测中,M3 的成绩全面超越 GPT-5.5、Gemini 3.1 Pro 等顶级闭源模型,甚至在某些场景下击败了 Claude Opus 4.7。
三项全能:国产旗舰首次集齐编程、百万上下文与多模态
M3 是 MiniMax 宣称的首个“Frontier Coding & Agentic · 百万上下文 · 原生多模态”三项能力兼备的国产模型。在编程评测集 SWE-Bench Pro 上,M3 得分 59.0%,超过 GPT-5.5(57.2%)和 Gemini 3.1 Pro(55.8%),接近 Opus 4.7(60.3%)。在 Agent 评测 Claw-Eval 中,M3 获得最高分。在多模态测试 OmniDocBench 上,M3 得分超过 Gemini 3.1 Pro。此外,M3 在 BrowseComp 智能体评测中以 83.5 分超越 Opus 4.7(79.3),展现出卓越的自主浏览与信息检索能力。M3 不仅支持文本和图像输入,还能处理视频、音频,并具备跨应用操作桌面的“Computer Use”能力,成为国内首个原生多模态开源模型。

12 小时自主复现论文,M3 的编码与 Agent 能力有多强
MiniMax 官方用一个极端测试验证了 M3 的综合能力:他们给 M3 一篇 ICLR 2025 杰出论文《Learning Dynamics of LLM Finetuning》,要求独立复现核心实验。M3 连续运行近 12 小时,全程自主产出 18 次 commit 与 23 张实验图表,成功跑通核心实验。多模态能力让它看懂论文里的图表公式,百万上下文保证论文、代码与实验日志一次性全部进窗口,编程与 Agent 能力驱动长线程执行。另一个更考验 Autonomous Agent 的测试中,M3 被丢给四个只完成预训练的 Base 模型,要求在 12 小时内自主完成数据合成、训练、评测、迭代全流程,全程无人干预。M3 最终得分 37.1,位列第三,仅次于 Opus 4.7(42.4)和 GPT-5.5(39.3),展现出媲美顶级闭源模型的自动化开发能力。
稀疏注意力架构解密:百万级上下文也能飞速响应
M3 采用全新的 MiniMax Sparse Attention(MSA)架构,在 100 万上下文下每 token 计算量仅为上代模型的 1/20,prefilling 阶段加速超 9 倍,decoding 阶段加速超 15 倍。这种架构通过稀疏注意力机制大幅降低长上下文场景下的计算开销,使得百万级上下文窗口不仅能存下,还能跑得快。M3 还具备原生多模态能力,重构了数据管线,将预训练数据规模扩充至百 T 量级,从第零步开始多模态训练,使文本和视觉语义空间高度对齐。这意味着 M3 可以同时理解长文档、图表、视频和代码,并能边看边推理。
开源开放与定价策略:开发者如何低成本接入
MiniMax M3 即将在 HuggingFace 和 GitHub 上完成开源,支持私有集群部署和微调。API 方面,官方提供标准版和高速版(结果完全一致,速度更快),全面支持自动 Cache。价格上,M3 API 上下文 ≤ 512K 的价格在 7 天内限时五折:输出价格标准版 8.4 元/百万 tokens,优先版 12.6 元/百万 tokens;缓存读取仅为 0.42 元/百万 tokens。订阅套餐方面,Token Plan 升级为基于积分的用量扣减,统一额度池覆盖所有模型,不再按能力拆分。Plus 档位 49 元/月,Max 119 元/月,Ultra 469 元/月。老套餐用户会获得一次性补偿积分以平滑过渡。
从 API 到订阅:新套餐与迁移补偿详解
MiniMax 同步推出了基于积分的新订阅方案 Token Plan 2.0。核心变化包括:统一额度池——所有模型(包括 M3)共用同一套积分额度,不再像以前那样给不同能力单独拆分额度;积分按用量扣减,用户只需关注总积分余额。当前公开档位为 Plus、Max 和 Ultra。为帮助老用户平稳过渡,部分老套餐用户将获得一次性补偿积分,与套餐内积分共用使用池,但拥有独立有效期。具体金额和有效期以控制台展示为准。此外,MiniMax 还推出了 Agent 产品 MiniMax Code,进一步降低开发者构建智能体应用的门槛。