华为云与 MiniMax 最新模型 M3 实现开源首发适配，提供 Tokens 算力支持

1 个月前

AI资讯

50 阅读

MiniMax M3 [华为云开源适配]

昇腾算力底座护航，M3实现开源首发适配

6月12日，华为云与MiniMax原生多模态旗舰模型M3正式完成开源首发适配。此次合作依托华为云昇腾算力底座，为M3提供强劲的Tokens算力支持。这意味着企业用户和开发者可基于华为云平台直接调用M3模型的强大能力，无需担心底层算力瓶颈。华为云通过“百模千态”生态布局，将M3纳入其热门模型矩阵，使模型部署与调用变得像API服务一样便捷，大幅降低企业AI应用的准入门槛。

华为云与 MiniMax 最新模型 M3 实现开源首发适配，提供 Tokens 算力支持

关键技术突破：MSA算子适配与MOE均衡优化

为了在昇腾算力上充分发挥M3的性能，双方团队完成了多项底层技术攻坚。其中，MSA（Multi-Head Self-Attention）算子已针对昇腾架构完成精准适配，配合精确的KV分块与连续访存策略，使得M3的Context Scaling能力得以完整释放。此外，M3的MOE（Mixture of Experts）均衡策略也在昇腾算力上成功落地，确保大模型在多专家路由时保持高吞吐与低延迟。这些优化共同保障了M3在处理长文本、高并发请求时的稳定性和效率。

打通“算力”到“企业生产力”的闭环

华为云与MiniMax的合作不止于技术适配，更着眼于产业落地。华为云基于昇腾算力底座，为MiniMax提供规模化、高性价比的Tokens算力服务，帮助M3快速从实验室走向企业生产环境。企业可在华为云上直接获取M3的推理能力，用于多模态内容生成、智能客服、知识库检索等场景。双方通过“算力+模型”的一体化交付，构建起从算力供应到业务赋能的价值闭环，加速多模态大模型在千行百业的落地进程。

华为云与 MiniMax 最新模型 M3 实现开源首发适配，提供 Tokens 算力支持

昇腾算力底座护航，M3实现开源首发适配

关键技术突破：MSA算子适配与MOE均衡优化

打通“算力”到“企业生产力”的闭环

链接失效反馈