2026年5月25日,面壁智能联合清华大学、OpenBMB开源社区正式发布国内首个基于华为昇腾平台训练的1.58-bit(三值)开源大模型BitCPM-CANN。该模型实现低比特训练全链路原生开发,覆盖0.5B至8B四个参数版本,推理阶段可释放约6倍显存红利,8B版本可直接运行在主流旗舰手机端,验证了国产算力+前沿算法的落地潜力。
大模型端侧落地的最大瓶颈,长期停留在显存占用与性能表现的平衡难题上。过去行业普遍采用训练后量化的方案压缩模型体积,但往往伴随明显的性能损耗,而适配国产算力平台的原生低比特训练模型,更是始终处于空白状态。
本次发布的BitCPM-CANN,是国内首个完全基于华为昇腾计算平台原生训练的1.58-bit三值大模型,核心突破在于实现了从量化算子到训练算法的全链路原生开发,而非传统的后量化处理。
面壁智能团队基于MindSpeed与Megatron-LM框架搭建了专属低比特训练管线,最终推出0.5B、1B、3B、8B四个参数尺寸的版本,与同尺寸全精度MiniCPM4模型的对照评测显示,其核心能力损失控制在可忽略的范围内,同时推理阶段可释放约6倍显存红利。
显存占用的大幅下降,直接打通了大模型进入消费级端侧设备的最后一公里。以8B参数版本为例,同等条件下全精度模型运行需要至少10GB以上显存,而BitCPM-CANN仅需不到2GB显存即可流畅运行,完全适配当前主流旗舰手机的内存配置,无需调用云端算力即可实现本地复杂推理。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
25 分钟前
近期产业链消息显示,英伟达面向消费级轻薄本打造的专用AI处理器N1X即将发布,其核心AI算力较当前主流移动端NPU提升超200%,可支持端侧流畅运行70B参数量化大语言模型。该产品将补齐主流价位轻薄本的AI运算短板,推动4000元级AI PC产品落地,同时为端侧AI应用生态扩张提供统一的硬件算力基准。

53 分钟前
2026年5月25日,全国网络安全标准化技术委员会正式发布《人工智能应用伦理安全指引1.0》,该文件由阿里、华为、DeepSeek等头部科技企业及科研机构联合起草,标志着我国AI伦理安全治理从顶层倡议阶段进入技术标准落地阶段,将为AI全产业链各参与方提供可落地的伦理安全操作框架,覆盖开发、服务、使用全流程合规要求。

1 小时前
2026年5月25日,中国人工智能企业DeepSeek宣布,旗下旗舰大模型DeepSeek-V4-Pro将原定于5月31日结束的2.5折限时优惠转为永久定价,相当于在原价基础上降价75%。第三方权威评测机构Artificial Analysis的基准测试数据显示,该模型凭借这一定价登顶全球大模型性价...

1 小时前
2026年5月25日,埃隆·马斯克宣布其创办的人工智能公司xAI已完成旗舰大模型Grok V9-Medium的训练工作。该模型参数规模达1.5万亿,为当前支撑Grok全产品线流量的V8-small版本的3倍,重点强化编程任务处理能力,目前已进入监督微调阶段,预计2-3周内正式面向公众开放。

1 小时前
2026年5月披露的监管文件显示,2023年5月Zoom通过旗下创投部门Zoom Ventures向AI初创企业Anthropic投资的5100万美元,当前估值已攀升至近13亿美元,账面回报超10亿美元。这笔投资最初锚定Anthropic旗下Claude大语言模型的技术整合需求,也成为近三年全球企业战略投资AI赛道的标杆案例。

1 小时前
第三方大模型聚合平台OpenRouter2026年5月发布的监测数据显示,5月18日至24日当周全球大模型总调用量达28.9万亿Token,环比增长7.4%,实现连续五周上涨。其中中国大模型周调用量达9.223万亿Token、环比增19.89%,已连续四周超过美国的4.93万亿Token,全球AI开发正呈现向东看的国产化转移趋势。

1 小时前
2026年最新行业追踪研究显示,当前互联网平台AI生成的英文文章数量已正式超过人类创作,占比达50%。这类被称为“Slop”的低质批量AI内容正快速占领社交等内容渠道,不仅可能导致人类原创文字成为稀缺品,更引发大语言模型训练养料枯竭、人类思考能力退化的双重隐忧。

1 小时前
2026年5月发布的最新行业追踪研究显示,当前互联网公开域内AI生成的英文内容占比首次超过人类,每两篇英文内容中就有一篇由机器产出。这类被命名为“Slop”的批量低质内容已渗透各大主流社交平台,不仅可能弱化人类主动思考能力,更可能导致大语言模型训练数据枯竭,引发全行业发展隐忧。