2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。
在闭源模型能力快速迭代的当下,头部科技厂商正在将端侧开源模型的能效比推向新的天花板,谷歌DeepMind此次发布的Gemma 4系列,正是瞄准了轻量化开源模型的性能缺口,引发全球AI开发者圈的广泛关注。
近两年大模型产业的竞争正在从单纯的参数规模比拼,转向落地场景的适配能力角逐。随着端侧AI功能成为智能手机、智能汽车、IoT设备的标配,市场对中小参数、可离线运行的开源模型需求暴涨,但此前多数小参数模型都存在推理能力不足、难以支撑复杂任务的问题,无法满足商用场景的要求。
中小参数模型的“单位参数能效”,已经成为当前大模型赛道比拼的核心指标。
此次发布的Gemma 4系列共包含4种参数规格,覆盖从端侧到云端的全场景需求:最小2B参数版本可直接在主流手机上离线运行,最高31B参数版本则主打云端复杂推理场景。
根据谷歌DeepMind公布的测试数据,Gemma 4全系列的单位参数性能,超越了参数规模为其20倍的前代开源模型,实现了跨量级的能效提升。其中31B参数版本在行业公认的Arena AI文本排行榜上位列全球开放模型第三位,在高难度科学推理基准GPQA Diamond上达到85.7%的准确率,仅略低于阿里云通义千问Qwen3.5 27B版本的得分。
值得注意的是,Gemma 4全系列均开放免费商用授权,个人开发者和企业无需额外申请即可将其整合到商业产品中,大幅降低了AI应用的开发门槛。
在Gemma 4之前,能在手机端流畅运行的开源模型大多只能支撑聊天、文本摘要等简单任务,而Gemma 4的2B参数版本已经可以完成基础逻辑推理、简单智能体工作流调度等复杂任务,这意味着未来更多不需要联网的本地AI功能将快速普及。
业内人士指出,谷歌此次释放的开源模型能力,将进一步倒逼整个开源大模型赛道的技术迭代,未来1-2年内,端侧设备搭载的本地大模型能力有望追上当前主流云端模型的水平,同时用户的隐私安全也将得到更好的保障。

(图像由AI生成)

2 小时前
2026年4月3日,Cursor团队正式推出代码编辑器Cursor 3版本,核心搭载智能体统一工作区,支持多智能体协同、本地与云端多代码仓库无缝切换,开发者可通过多终端启动智能体,将软件开发模式从传统人机协作升级为智能体自主工作阶段,可大幅降低跨环境开发的沟通与操作成本。

3 小时前
2026年4月3日,谷歌正式发布Gemini API全新定价策略,新增标准、弹性、优先、批量、缓存五大服务档位,其中弹性、批量档位推理成本较标准档直降50%,分别适配延迟容忍度1-15分钟、最长24小时的非实时场景,可满足不同开发者从实时调用到大规模离线处理的多元算力需求。

3 小时前
2026年4月3日,谷歌DeepMind正式发布新一代开源大模型系列Gemma4,本次迭代距上一代产品发布间隔一年,不仅将开源协议更换为支持免费商用的Apache2.0,还推出4款覆盖端侧到数据中心的不同规格产品,其中310亿参数旗舰版性能位列Arena AI开源排行榜第三,单张H100显卡即可运行。

4 小时前
近期微软调整旗下AI业务核心战略,从此前依赖OpenAI GPT系列技术支撑Copilot等智能产品,转向投入超110亿美元搭建自研大模型团队,目标在2025年底前推出完全自主可控的通用AI底座,替代现有外采技术方案,相关调整已覆盖云计算、办公AI、消费级智能助手三大核心业务线。

4 小时前
2026年3月底小米正式面向全球开发者推出自研MiMo大模型首个Token Plan订阅套餐,共设四档月费39元至659元,通过统一Credit点数实现多模型多模态调用透明计费。旗下MiMo-V2-Pro模型以万亿参数、百万上下文窗口位列全球大模型评测第五,目前MiMo系列周调用量已突破4万亿Token,此举标志小米AI商业化进入规模化交付阶段。

4 小时前
2026年4月3日滴滴公开最新运营数据,其旗下AI出行助手“小滴”近一周活跃用户较年初增长37倍,00后用户占比超40%。2026年清明假期全国交通枢纽打车需求预计同比上涨239%、异地用车需求增近40%,滴滴依托大模型技术升级调度体系,推动出行服务从“打到车”向“打对车”升维。

9 小时前
北京时间2026年4月3日,谷歌正式推出全新开源大模型Gemma4,该系列基于Gemini3技术栈打造,共包含2.3B、4.5B高效版及26B MoE、31B稠密版四种规格,全系支持多模态输入,高效版原生支持端侧实时语音理解,31B稠密版本在Arena AI文本榜单中位列全球开源模型第三,大幅降低前沿AI能力的本地部署门槛。

9 小时前
2026年4月3日,谷歌正式发布新一代开源AI模型Gemma4,放弃此前Gemma系列采用的限制性自定义许可,改用行业通用的Apache2.0开源协议,允许全球开发者自由使用、修改、分发模型并用于商用场景。该模型在性能与生态兼容性上实现双重升级,可大幅降低AI落地的技术与法律门槛。