面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

1 个月前

AI资讯

90 阅读

国产大模型华为昇腾端侧AI 低比特量化

国产算力首次跑通1.58-bit大模型完整闭环

5月23日，面壁智能、清华大学及OpenBMB开源社区联合推出BitCPM-CANN，这是全球范围内首个完全基于华为昇腾910B NPU原生训练并开源的三值（1.58-bit）大模型。从量化算子、训练算法到全链路框架，全部在国产算力平台上完成，彻底改变了以往低比特大模型核心技术路线完全依赖国外平台的局面。BitCPM-CANN系列包含0.5B、1B、3B、8B四个参数量版本，与同尺寸MiniCPM4全精度家族逐项对照评测，中英双语通用能力保留率达到95%以上，在10亿到80亿参数区间内表现优异。面壁智能基于MindSpeed × Megatron-LM主干搭建了完整的低比特训练底座，涵盖环境适配、32K长序列支持、并行策略及融合算子等工程体系，所有面向昇腾的低比特训练工作从此可建立在同一套公共基础设施之上。

面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

六倍显存红利让8B旗舰大模型轻松入驻手机

BitCPM-CANN最显著的价值在于其极致的存储效率。相比传统BF16精度，该模型在推理阶段释放约6倍显存红利。这意味着一个8B参数的BitCPM-CANN大模型，可以轻松运行在当前主流旗舰手机之上，无需依赖额外算力或云侧推理。面壁智能指出，当前大模型行业正经历“内存危机”，被迫在模型能力与内存预算之间做取舍。BitCPM-CANN通过1.58-bit极低位宽，在完全国产的华为昇腾平台上实现接近全精度的能力保留（90%–97.2%），将技术突破转化为可量产的工程价值。未来结合混合专家模型（MoE）和算力卸载/显存卸载技术，有望把60B级别的大模型装入手机，彻底打破“端侧模型太小能力不足、太大跑不动”的两难困境。

从算法到框架全链路原生昇腾，构建自主低位宽生态

面壁智能是华为在端侧大模型领域重要的技术合作伙伴，双方自2024年起在低比特量化训练和端侧推理深度优化上持续联合创新。BitCPM-CANN的成功，验证了华为昇腾AI芯片在手机、PC、汽车、物联网等场景驱动“杀手级应用”的潜力。对中国AI产业而言，这开辟了一条不依赖国外高端芯片、用高效模型和自主算力实现端侧智能的新路径。面壁智能秉承全面开源理念，将0.5B/1B/3B/8B全系列模型权重开源，让开发者、企业和科研机构零门槛体验国产算力在低位宽场景下的真实性能。同时，面壁通过对大模型训练过程精准建模，打造出更高效的Scaling Law增长曲线，实现同等参数性能更优、同等性能参数更小的效果，进一步巩固了国产算力与国产模型的协同影响力。

面壁智能联合清华等开源中国首个基于华为昇腾训练的 1.58-bit 端侧大模型 BitCPM-CANN

国产算力首次跑通1.58-bit大模型完整闭环

六倍显存红利让8B旗舰大模型轻松入驻手机

从算法到框架全链路原生昇腾，构建自主低位宽生态

链接失效反馈