Anthropic交表，MiniMax冲A，而我最想聊的是M3大模型

1 个月前

AI资讯

49 阅读

MiniMax [Anthropic M3 模型蒸馏]

几万个假账号疯狂刷数据：Anthropic的愤怒与无奈

Anthropic在最新提交的文件中指控DeepSeek、MiniMax和Moonshot三家公司，通过创建数万个欺诈性账户，持续向Claude发送海量查询，意图将模型能力“蒸馏”至自家模型。这种攻击模式被描述为“吸干精华再练功”，手段隐蔽而高效。尽管Anthropic以“受害者”姿态诉诸法律与监管，但行业内更关注的是：这种蒸馏行为是否恰恰反衬出中国AI在追赶前沿时的激进野心？而MiniMax M3的横空出世，或许正是这场“偷师”与技术内功结合的结果。

MiniMax M3：首个把“Frontier”带进开放世界的全能模型

M3并非简单的版本迭代，而是MiniMax产品矩阵的一次质变。基于自研的MiniMax Sparse Attention（MSA）架构，API最高支持1M tokens上下文窗口，并保障至少512K tokens可用——这为长程Agent、长程Coding、长视频理解提供了关键基础设施。在BrowseComp智能体评测中，M3以83.5分超越Opus 4.7的79.3分，展现出强大的自主浏览与信息检索能力。同时，Coding能力与国际顶尖闭源模型看齐：在涵盖软件工程、终端执行等多项权威评测中均达到领先水平。

说服力的铁证：12小时自主复现ICLR论文与24小时GPU Kernel优化竞赛

M3的“硬核”绝非纸上谈兵。MiniMax公开了两次极端测试：

自主复现ICLR 2025杰出论文：M3被要求独立复现《Learning Dynamics of LLM Finetuning》。它连续运行近12小时，全程自主产出18次commit与23张实验图表，成功跑通核心实验。多模态看懂了论文中的图表公式，长上下文保证了论文代码与实验日志一次性进入窗口，编程与Agent能力驱动了长线程执行。
FP8矩阵乘Kernel优化：这是大模型推理计算量最集中的环节。M3仅凭一份任务描述和一个无法运行的Triton骨架，在约24小时内完成147次benchmark提交、1959次工具调用，将硬件峰值利用率从7.6%推进至71.3%，实现9.4×加速——全程零人工介入。

更令人震撼的是“自主训练”实验：M3被交给四个只完成预训练的Base模型，要求在12小时内自主完成数据合成、训练、评测、迭代全流程，让它们在数学推理、代码生成、知识问答等任务上具备能力。结果M3最终得分37.1，位列第三，仅次于Opus 4.7（42.4）和GPT-5.5（39.3），明显领先其余模型。

开源宣言：Frontier不应该只属于几家闭源公司

MiniMax明确表示，M3即将在HuggingFace和GitHub上完成开源，支持私有集群部署和微调。这意味着第一个把完整frontier能力（Coding前沿、百万上下文、原生多模态）带进开放世界的模型，将由一家中国公司提供。面对外界“是否只是宣传”的质疑，MiniMax拿出了上述可复现的测试案例；而另一位网友的评价也道出多数人的心声：“M3作为开源模型能紧追Opus和GPT-5已经很厉害了，不过在信这些宣传之前，我得亲眼看看它现场翻车。”——这正是M3选择开源的最佳理由：让每个开发者都能亲手验证，而非仅听信官方报告。

Anthropic交表，MiniMax冲A，而我最想聊的是M3大模型

几万个假账号疯狂刷数据：Anthropic的愤怒与无奈

MiniMax M3：首个把“Frontier”带进开放世界的全能模型

说服力的铁证：12小时自主复现ICLR论文与24小时GPU Kernel优化竞赛

开源宣言：Frontier不应该只属于几家闭源公司

链接失效反馈