Anthropic交表,MiniMax冲A,而我最想聊的是M3大模型

几万个假账号疯狂刷数据:Anthropic的愤怒与无奈

Anthropic在最新提交的文件中指控DeepSeek、MiniMax和Moonshot三家公司,通过创建数万个欺诈性账户,持续向Claude发送海量查询,意图将模型能力“蒸馏”至自家模型。这种攻击模式被描述为“吸干精华再练功”,手段隐蔽而高效。尽管Anthropic以“受害者”姿态诉诸法律与监管,但行业内更关注的是:这种蒸馏行为是否恰恰反衬出中国AI在追赶前沿时的激进野心?而MiniMax M3的横空出世,或许正是这场“偷师”与技术内功结合的结果。

MiniMax M3:首个把“Frontier”带进开放世界的全能模型

M3并非简单的版本迭代,而是MiniMax产品矩阵的一次质变。基于自研的MiniMax Sparse Attention(MSA)架构,API最高支持1M tokens上下文窗口,并保障至少512K tokens可用——这为长程Agent、长程Coding、长视频理解提供了关键基础设施。在BrowseComp智能体评测中,M3以83.5分超越Opus 4.7的79.3分,展现出强大的自主浏览与信息检索能力。同时,Coding能力与国际顶尖闭源模型看齐:在涵盖软件工程、终端执行等多项权威评测中均达到领先水平。

说服力的铁证:12小时自主复现ICLR论文与24小时GPU Kernel优化竞赛

M3的“硬核”绝非纸上谈兵。MiniMax公开了两次极端测试:

  • 自主复现ICLR 2025杰出论文:M3被要求独立复现《Learning Dynamics of LLM Finetuning》。它连续运行近12小时,全程自主产出18次commit与23张实验图表,成功跑通核心实验。多模态看懂了论文中的图表公式,长上下文保证了论文代码与实验日志一次性进入窗口,编程与Agent能力驱动了长线程执行。
  • FP8矩阵乘Kernel优化:这是大模型推理计算量最集中的环节。M3仅凭一份任务描述和一个无法运行的Triton骨架,在约24小时内完成147次benchmark提交、1959次工具调用,将硬件峰值利用率从7.6%推进至71.3%,实现9.4×加速——全程零人工介入。

更令人震撼的是“自主训练”实验:M3被交给四个只完成预训练的Base模型,要求在12小时内自主完成数据合成、训练、评测、迭代全流程,让它们在数学推理、代码生成、知识问答等任务上具备能力。结果M3最终得分37.1,位列第三,仅次于Opus 4.7(42.4)和GPT-5.5(39.3),明显领先其余模型。

开源宣言:Frontier不应该只属于几家闭源公司

MiniMax明确表示,M3即将在HuggingFace和GitHub上完成开源,支持私有集群部署和微调。这意味着第一个把完整frontier能力(Coding前沿、百万上下文、原生多模态)带进开放世界的模型,将由一家中国公司提供。面对外界“是否只是宣传”的质疑,MiniMax拿出了上述可复现的测试案例;而另一位网友的评价也道出多数人的心声:“M3作为开源模型能紧追Opus和GPT-5已经很厉害了,不过在信这些宣传之前,我得亲眼看看它现场翻车。”——这正是M3选择开源的最佳理由:让每个开发者都能亲手验证,而非仅听信官方报告。