MiniMax M3 模型正式开源：原生多模态、百万上下文

1 小时前

AI资讯

2 阅读

大语言模型多模态开源模型百万上下文

MiniMax 稀宇科技于今日正式发布 M3 大模型，在编码、多模态理解和超长上下文处理三大领域实现技术突破。基于自研 MiniMax Sparse Attention（MSA）架构，M3 的 API 最高支持 1M tokens 上下文窗口，并保障至少 512K tokens 的稳定可用性。在多项权威评测中，M3 的成绩全面超越 GPT-5.5、Gemini 3.1 Pro 等顶级闭源模型，甚至在某些场景下击败了 Claude Opus 4.7。

三项全能：国产旗舰首次集齐编程、百万上下文与多模态

M3 是 MiniMax 宣称的首个“Frontier Coding & Agentic · 百万上下文 · 原生多模态”三项能力兼备的国产模型。在编程评测集 SWE-Bench Pro 上，M3 得分 59.0%，超过 GPT-5.5（57.2%）和 Gemini 3.1 Pro（55.8%），接近 Opus 4.7（60.3%）。在 Agent 评测 Claw-Eval 中，M3 获得最高分。在多模态测试 OmniDocBench 上，M3 得分超过 Gemini 3.1 Pro。此外，M3 在 BrowseComp 智能体评测中以 83.5 分超越 Opus 4.7（79.3），展现出卓越的自主浏览与信息检索能力。M3 不仅支持文本和图像输入，还能处理视频、音频，并具备跨应用操作桌面的“Computer Use”能力，成为国内首个原生多模态开源模型。

MiniMax M3 模型正式开源：原生多模态、百万上下文

12 小时自主复现论文，M3 的编码与 Agent 能力有多强

MiniMax 官方用一个极端测试验证了 M3 的综合能力：他们给 M3 一篇 ICLR 2025 杰出论文《Learning Dynamics of LLM Finetuning》，要求独立复现核心实验。M3 连续运行近 12 小时，全程自主产出 18 次 commit 与 23 张实验图表，成功跑通核心实验。多模态能力让它看懂论文里的图表公式，百万上下文保证论文、代码与实验日志一次性全部进窗口，编程与 Agent 能力驱动长线程执行。另一个更考验 Autonomous Agent 的测试中，M3 被丢给四个只完成预训练的 Base 模型，要求在 12 小时内自主完成数据合成、训练、评测、迭代全流程，全程无人干预。M3 最终得分 37.1，位列第三，仅次于 Opus 4.7（42.4）和 GPT-5.5（39.3），展现出媲美顶级闭源模型的自动化开发能力。

稀疏注意力架构解密：百万级上下文也能飞速响应

M3 采用全新的 MiniMax Sparse Attention（MSA）架构，在 100 万上下文下每 token 计算量仅为上代模型的 1/20，prefilling 阶段加速超 9 倍，decoding 阶段加速超 15 倍。这种架构通过稀疏注意力机制大幅降低长上下文场景下的计算开销，使得百万级上下文窗口不仅能存下，还能跑得快。M3 还具备原生多模态能力，重构了数据管线，将预训练数据规模扩充至百 T 量级，从第零步开始多模态训练，使文本和视觉语义空间高度对齐。这意味着 M3 可以同时理解长文档、图表、视频和代码，并能边看边推理。

开源开放与定价策略：开发者如何低成本接入

MiniMax M3 即将在 HuggingFace 和 GitHub 上完成开源，支持私有集群部署和微调。API 方面，官方提供标准版和高速版（结果完全一致，速度更快），全面支持自动 Cache。价格上，M3 API 上下文 ≤ 512K 的价格在 7 天内限时五折：输出价格标准版 8.4 元/百万 tokens，优先版 12.6 元/百万 tokens；缓存读取仅为 0.42 元/百万 tokens。订阅套餐方面，Token Plan 升级为基于积分的用量扣减，统一额度池覆盖所有模型，不再按能力拆分。Plus 档位 49 元/月，Max 119 元/月，Ultra 469 元/月。老套餐用户会获得一次性补偿积分以平滑过渡。

从 API 到订阅：新套餐与迁移补偿详解

MiniMax 同步推出了基于积分的新订阅方案 Token Plan 2.0。核心变化包括：统一额度池——所有模型（包括 M3）共用同一套积分额度，不再像以前那样给不同能力单独拆分额度；积分按用量扣减，用户只需关注总积分余额。当前公开档位为 Plus、Max 和 Ultra。为帮助老用户平稳过渡，部分老套餐用户将获得一次性补偿积分，与套餐内积分共用使用池，但拥有独立有效期。具体金额和有效期以控制台展示为准。此外，MiniMax 还推出了 Agent 产品 MiniMax Code，进一步降低开发者构建智能体应用的门槛。

MiniMax M3 模型正式开源：原生多模态、百万上下文

三项全能：国产旗舰首次集齐编程、百万上下文与多模态

12 小时自主复现论文，M3 的编码与 Agent 能力有多强

稀疏注意力架构解密：百万级上下文也能飞速响应

开源开放与定价策略：开发者如何低成本接入

从 API 到订阅：新套餐与迁移补偿详解

链接失效反馈