面壁智能联合清华大学与OpenBMB社区正式发布并开源中国首个完全基于华为昇腾NPU训练的端到端1.58-bit三值大模型BitCPM-CANN,涵盖0.5B至8B四个尺寸,推理时相比BF16释放约6倍显存,模型能力保留率高达90%–97.2%,为国产算力跑通低比特端侧大模型树立新标杆。