2026年4月,谷歌DeepMind首席执行官Demis Hassabis通过社交平台暗示,新一代开源大模型Gemma 4即将正式发布。该模型参数规模达120B,为上代Gemma 3的4倍,采用MoE混合专家架构,激活参数仅15B,有望在民用级显卡实现本地离线运行。谷歌意在借这款产品,从中国厂商主导的开源大模型市场夺回话语权。
就在Gemma 3发布满一周年的节点,Demis Hassabis在个人社交账号发布的四颗钻石图标迅速引发AI圈热议,不少业内人士第一时间将其与Gemma系列的第四代产品挂钩。而从谷歌过往的大模型迭代节奏来看,每年升级一代开源大模型的规划早已明确,此次预热也完全符合其对外公布的产品路线图。
作为Gemma系列问世以来最大的一次规格升级,Gemma 4的参数规模直接从上代的30B跃升至120B,翻了整整四倍。为了避免大参数带来的部署门槛提升,谷歌为其搭载了MoE混合专家架构,实际运行时的激活参数仅为15B——这也意味着,经过4bit或8bit量化之后,这款120B参数的大模型完全可以在RTX 4090/5090这类民用消费级显卡上实现本地离线运行,无需依赖云端算力。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录