2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。
在闭源模型能力快速迭代的当下,头部科技厂商正在将端侧开源模型的能效比推向新的天花板,谷歌DeepMind此次发布的Gemma 4系列,正是瞄准了轻量化开源模型的性能缺口,引发全球AI开发者圈的广泛关注。
近两年大模型产业的竞争正在从单纯的参数规模比拼,转向落地场景的适配能力角逐。随着端侧AI功能成为智能手机、智能汽车、IoT设备的标配,市场对中小参数、可离线运行的开源模型需求暴涨,但此前多数小参数模型都存在推理能力不足、难以支撑复杂任务的问题,无法满足商用场景的要求。
中小参数模型的“单位参数能效”,已经成为当前大模型赛道比拼的核心指标。
此次发布的Gemma 4系列共包含4种参数规格,覆盖从端侧到云端的全场景需求:最小2B参数版本可直接在主流手机上离线运行,最高31B参数版本则主打云端复杂推理场景。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录