华为云与 MiniMax 最新模型 M3 实现开源首发适配,提供 Tokens 算力支持
昇腾算力底座护航,M3实现开源首发适配
6月12日,华为云与MiniMax原生多模态旗舰模型M3正式完成开源首发适配。此次合作依托华为云昇腾算力底座,为M3提供强劲的Tokens算力支持。这意味着企业用户和开发者可基于华为云平台直接调用M3模型的强大能力,无需担心底层算力瓶颈。华为云通过“百模千态”生态布局,将M3纳入其热门模型矩阵,使模型部署与调用变得像API服务一样便捷,大幅降低企业AI应用的准入门槛。

关键技术突破:MSA算子适配与MOE均衡优化
为了在昇腾算力上充分发挥M3的性能,双方团队完成了多项底层技术攻坚。其中,MSA(Multi-Head Self-Attention)算子已针对昇腾架构完成精准适配,配合精确的KV分块与连续访存策略,使得M3的Context Scaling能力得以完整释放。此外,M3的MOE(Mixture of Experts)均衡策略也在昇腾算力上成功落地,确保大模型在多专家路由时保持高吞吐与低延迟。这些优化共同保障了M3在处理长文本、高并发请求时的稳定性和效率。
打通“算力”到“企业生产力”的闭环
华为云与MiniMax的合作不止于技术适配,更着眼于产业落地。华为云基于昇腾算力底座,为MiniMax提供规模化、高性价比的Tokens算力服务,帮助M3快速从实验室走向企业生产环境。企业可在华为云上直接获取M3的推理能力,用于多模态内容生成、智能客服、知识库检索等场景。双方通过“算力+模型”的一体化交付,构建起从算力供应到业务赋能的价值闭环,加速多模态大模型在千行百业的落地进程。