登录体验完整功能（收藏、点赞、评论等） — 已累计有 9869 人加入

面壁智能联合清华发布国内首个昇腾训练1.58-bit开源大模型

AI创作导航管理员 LV3 进阶萌新

1 小时前

风向

17

2026年5月25日，面壁智能联合清华大学、OpenBMB开源社区正式发布国内首个基于华为昇腾平台训练的1.58-bit（三值）开源大模型BitCPM-CANN。该模型实现低比特训练全链路原生开发，覆盖0.5B至8B四个参数版本，推理阶段可释放约6倍显存红利，8B版本可直接运行在主流旗舰手机端，验证了国产算力+前沿算法的落地潜力。

大模型端侧落地的最大瓶颈，长期停留在显存占用与性能表现的平衡难题上。过去行业普遍采用训练后量化的方案压缩模型体积，但往往伴随明显的性能损耗，而适配国产算力平台的原生低比特训练模型，更是始终处于空白状态。

本次发布的BitCPM-CANN，是国内首个完全基于华为昇腾计算平台原生训练的1.58-bit三值大模型，核心突破在于实现了从量化算子到训练算法的全链路原生开发，而非传统的后量化处理。

面壁智能团队基于MindSpeed与Megatron-LM框架搭建了专属低比特训练管线，最终推出0.5B、1B、3B、8B四个参数尺寸的版本，与同尺寸全精度MiniCPM4模型的对照评测显示，其核心能力损失控制在可忽略的范围内，同时推理阶段可释放约6倍显存红利。

显存占用的大幅下降，直接打通了大模型进入消费级端侧设备的最后一公里。以8B参数版本为例，同等条件下全精度模型运行需要至少10GB以上显存，而BitCPM-CANN仅需不到2GB显存即可流畅运行，完全适配当前主流旗舰手机的内存配置，无需调用云端算力即可实现本地复杂推理。

大语言模型开源AI 华为昇腾面壁智能 1.58-bit大模型

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

相关网站

提示工程指南

提示工程领域专业学习平台

Claude

Claude 是由 Anthropic 研发的 AI 助手与大语言模型

OpenAI

OpenAI 是全球领先的人工智能研究机构与模型提供商

UGC Maker AI

AI驱动的UGC视频图片广告创

BannImage AI

AI图像视频生成工具，高效产出

Lunia

为2-10岁儿童生成心理学向个

Lumen Flow

AI漫剧自动生产线，输入剧本即

文枢三言

AI智能降重降AI率，高效提升

相关资讯

© 2026 AI创作导航. All Rights Reserved.

滇ICP备2026002425号-1 公安备案图标

公安备案图标

滇公网安备 53252802528133号