2026年5月,面壁智能联合清华大学、OpenBMB开源社区正式发布新一代端侧多模态大模型MiniCPM-V 4.6。该模型仅1.3B参数,推出Instruct与Thinking两个版本,在AA(Artificial Analysis)榜单拿下13分的成绩,性能不仅远超阿里Qwen3.5-0.8B、谷歌Gemma4-E2B-it等同尺寸竞品,更直逼2B参数级模型,为端侧AI规模化落地提供了高性价比的技术路径。
长期以来,端侧AI的落地始终卡在“性能”与“体积”的两难选择里:要足够好用的多模态理解能力,往往需要7B以上参数模型,普通消费级硬件根本跑不动;压缩到1-2B参数区间,又容易出现识别准确率低、推理能力弱的问题,难以支撑复杂场景需求。这一僵局最近被一款新发布的小参数模型打破。
随着消费电子、智能车、工业边缘设备的智能化升级,用户对本地AI能力的需求正在快速上涨。相较于云端AI,端侧推理具有延迟低、隐私性强、无需联网的优势,但硬件算力、存储的限制,决定了端侧部署的模型参数不能过高。
此前行业的普遍思路是通过压缩大模型适配端侧,但往往会损失较多性能,导致1B级参数的多模态模型大多只能承担简单的图像识别、指令响应任务,无法完成逻辑推理、多轮多模态交互等高阶需求,行业亟需在小参数体量下实现更高智能密度的技术方案。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录