登录体验完整功能(收藏、点赞、评论等) — 已累计有 9869 人加入

面壁智能联合清华发布国内首个昇腾训练1.58-bit开源大模型

2026年5月25日,面壁智能联合清华大学、OpenBMB开源社区正式发布国内首个基于华为昇腾平台训练的1.58-bit(三值)开源大模型BitCPM-CANN。该模型实现低比特训练全链路原生开发,覆盖0.5B至8B四个参数版本,推理阶段可释放约6倍显存红利,8B版本可直接运行在主流旗舰手机端,验证了国产算力+前沿算法的落地潜力。

大模型端侧落地的最大瓶颈,长期停留在显存占用与性能表现的平衡难题上。过去行业普遍采用训练后量化的方案压缩模型体积,但往往伴随明显的性能损耗,而适配国产算力平台的原生低比特训练模型,更是始终处于空白状态。

本次发布的BitCPM-CANN,是国内首个完全基于华为昇腾计算平台原生训练的1.58-bit三值大模型,核心突破在于实现了从量化算子到训练算法的全链路原生开发,而非传统的后量化处理。

面壁智能团队基于MindSpeed与Megatron-LM框架搭建了专属低比特训练管线,最终推出0.5B、1B、3B、8B四个参数尺寸的版本,与同尺寸全精度MiniCPM4模型的对照评测显示,其核心能力损失控制在可忽略的范围内,同时推理阶段可释放约6倍显存红利

显存占用的大幅下降,直接打通了大模型进入消费级端侧设备的最后一公里。以8B参数版本为例,同等条件下全精度模型运行需要至少10GB以上显存,而BitCPM-CANN仅需不到2GB显存即可流畅运行,完全适配当前主流旗舰手机的内存配置,无需调用云端算力即可实现本地复杂推理。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯