2026年5月26日,面壁智能联合清华大学、OpenBMB开源社区正式发布并开源低比特大模型训练成果BitCPM-CANN。该成果基于华为昇腾平台原生研发,覆盖0.5B至8B共4个模型尺寸,推理阶段可释放约6倍显存红利,大幅降低大模型端侧运行门槛,将有效推动端侧AI大模型的轻量化落地与商用普及。近两年,端侧AI成为消费电子领域的核心竞逐方向——本地运行的大模型无需上传用户数据到云端,响应速度更快、隐私安全性更高,却始终受限于移动设备显存天花板,高参数大模型很难下放到主流价位机型。此前消费电子厂商搭载的端侧大模型普遍以1B-3B参数为主,效果和云侧的7B、8B模型存在明显差距;而如果要在本地运行8B参数级别的全精度大模型,往往需要占用15G以上的显存空间,只有售价五六千元以上的顶级旗舰机型才能满足要求,很难向大众市场普及。行业此前的轻量化方案普遍存在参数缩水、能力下降明显的问题,始终没能找到兼顾性能和体积的最优解。本次面壁智能推出的BitCPM-CANN,是联合清华大学、OpenBMB开源社区共同研发的低比特训练成果,全程在华为昇腾平台原生完成研发适配,开源后所有开发者都可免费获取使用。...