近日谷歌正式发布全开源Gemma4系列大模型,该系列通过底层架构创新实现性能跨级跃升,其中最小激活参数量仅3.8亿的版本,性能超越参数规模20倍的同类大模型。Gemma4覆盖2.3B到31B多参数档位,可直接部署于手机、轻薄本等消费级终端,将大幅降低通用AI落地门槛。
图源: 图像由AI生成2026年4月7日,谷歌DeepMind团队推出的Gemma系列最新迭代Gemma4正式向全球开发者开放全量开源权限,这也是谷歌继2024年首次推出Gemma开源模型线以来,在轻量化大模型领域的最大幅度升级。
过去行业普遍将参数规模视为大模型性能的核心衡量标准,认为只有百亿、千亿级参数的模型才能实现稳定的通用推理能力,而Gemma4的发布直接打破了这一“参数迷信”。
本次发布的Gemma4系列覆盖多档位参数规格,包括有效参数量2.3B的gemma-4-E2B、4.5B的gemma-4-E4B、26B参数的混合专家模型,以及31B参数的稠密模型,可满足不同场景的部署需求。其中最受关注的轻量化版本**仅需激活3.8亿参数,就能在MMLU、GSM8K等主流权威测评榜单中,性能超越参数规模达20倍的70亿级同类模型**。
这一性能突破意味着AI能力不再需要依赖云端超算集群支撑,普通消费级硬件即可承载接近中大型模型的推理能力。
Gemma4的跨级性能表现,核心来自两项底层架构的针对性优化。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年4月7日,谷歌正式在iOS平台推出全离线语音听写应用Google AI Edge Eloquent,该产品基于谷歌自研轻量化大模型Gemma构建,可实现100%本地处理语音数据,无需联网即可完成转录、自动剔除语气词、文本润色等功能,既解决了高敏感场景的隐私泄露风险,也填补了离线语音转录智能优化的市场空白。

2 小时前
当地时间2026年4月6日,谷歌在iOS平台低调上线实验性语音输入应用Google AI Edge Eloquent。该产品搭载谷歌Gemma4系列自动语音识别模型,主打边缘侧离线运行、智能去杂润色功能,可实时将口语转化为专业文本。此举标志着谷歌正式入局由Wispr Flow、SuperWhisper领跑的高端AI语音转文字赛道。

8 小时前
2026年4月,谷歌低调推出面向iOS系统的离线优先AI听写应用,该产品搭载谷歌自研轻量级开源大模型Gemma,主打无网络环境下高准确率语音转写功能,直指当前听写赛道头部产品Wispr Flow,是谷歌在C端AI工具轻量化落地的最新动作,填补了其移动端离线语音交互产品的布局空白。

3 天前
谷歌近期正在推进端侧轻量化大模型Gemini Nano 4的终端适配工作,预计2025年第一季度发布的下一代安卓旗舰机型将率先搭载该模型。其端侧推理性能较上一代提升62%,支持离线语音交互、实时图像生成等12项新增本地AI功能,无需上传数据至云端即可完成运算,在隐私安全性、响应速度上均有显著提升。

3 天前
2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。

3 天前
2026年4月3日,谷歌正式发布Gemini API全新定价策略,新增标准、弹性、优先、批量、缓存五大服务档位,其中弹性、批量档位推理成本较标准档直降50%,分别适配延迟容忍度1-15分钟、最长24小时的非实时场景,可满足不同开发者从实时调用到大规模离线处理的多元算力需求。

3 天前
2026年4月3日,谷歌DeepMind正式发布新一代开源大模型系列Gemma4,本次迭代距上一代产品发布间隔一年,不仅将开源协议更换为支持免费商用的Apache2.0,还推出4款覆盖端侧到数据中心的不同规格产品,其中310亿参数旗舰版性能位列Arena AI开源排行榜第三,单张H100显卡即可运行。

4 天前
2026年4月消息,谷歌联合能源公司Crusoe Energy在美国得克萨斯州阿姆斯特朗县投建装机容量933兆瓦的天然气发电厂,为其Goodnight AI数据中心园区供电,项目已于今年1月提交许可并启动建设。电厂投用后年碳排放预计达450万吨,该举动引发行业对谷歌2030年零碳运营承诺能否兑现的广泛质疑。