登录体验完整功能(收藏、点赞、评论等) — 已累计有 11058 人加入

谷歌发布Gemma 4 12B多模态模型 无编码器架构降低本地部署门槛

详情页推荐

谷歌于2026年6月3日正式推出全新开源多模态大模型Gemma 4 12B,首次采用颠覆性“无编码器”架构,120亿参数规模下仅需16GB消费级内存即可实现本地即时推理,大幅降低多模态模型计算复杂度,为开源大模型生态下沉至消费端场景带来突破性可能,发布后迅速引发全球开源开发者的广泛讨论与测试。

配图

6月3日Gemma 4 12B刚上传至Hugging Face等主流开源模型平台,24小时内下载量就突破12万次,不少个人开发者晒出用普通消费级笔记本运行的实测视频:本地处理图文问答任务延迟普遍低于100ms,甚至能流畅运行4K图像实时解析、实时语音交互等多模态需求,性能表现远超同运行门槛的现有开源模型。

长期以来,多模态大模型的本地部署一直是行业痛点。传统多模态架构普遍依赖独立的视觉、音频编码器模块,需要先将图像、声音信号转换为与文本Token匹配的维度才能进行后续处理,额外的组件不仅推高了模型体积,也大幅提升了计算资源要求——此前10B级别的多模态模型要实现流畅本地推理,至少需要32GB以上的独立显存,普通消费级硬件根本无法承载,大量边缘端多模态应用只能使用效果严重缩水的裁剪小模型,开发者的创新空间也被算力门槛限制。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。