2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。
在闭源模型能力快速迭代的当下,头部科技厂商正在将端侧开源模型的能效比推向新的天花板,谷歌DeepMind此次发布的Gemma 4系列,正是瞄准了轻量化开源模型的性能缺口,引发全球AI开发者圈的广泛关注。
近两年大模型产业的竞争正在从单纯的参数规模比拼,转向落地场景的适配能力角逐。随着端侧AI功能成为智能手机、智能汽车、IoT设备的标配,市场对中小参数、可离线运行的开源模型需求暴涨,但此前多数小参数模型都存在推理能力不足、难以支撑复杂任务的问题,无法满足商用场景的要求。
中小参数模型的“单位参数能效”,已经成为当前大模型赛道比拼的核心指标。
此次发布的Gemma 4系列共包含4种参数规格,覆盖从端侧到云端的全场景需求:最小2B参数版本可直接在主流手机上离线运行,最高31B参数版本则主打云端复杂推理场景。
根据谷歌DeepMind公布的测试数据,Gemma 4全系列的单位参数性能,超越了参数规模为其20倍的前代开源模型,实现了跨量级的能效提升。其中31B参数版本在行业公认的Arena AI文本排行榜上位列全球开放模型第三位,在高难度科学推理基准GPQA Diamond上达到85.7%的准确率,仅略低于阿里云通义千问Qwen3.5 27B版本的得分。
值得注意的是,Gemma 4全系列均开放免费商用授权,个人开发者和企业无需额外申请即可将其整合到商业产品中,大幅降低了AI应用的开发门槛。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
4月10日,外媒The Information援引知情人士消息,首次披露埃隆·马斯克旗下太空企业SpaceX与AI子公司xAI的2025年合并财务数据。这份从未公开的财报显示,SpaceX全年营收超过185亿美元,约合人民币1267亿元,合并口径下净亏损近50亿美元,折合人民币约342亿元,亏损主要来自xAI的大模型研发投入,引发AI行业对前沿研发成本模式的关注。

3 小时前
网络研究机构Graphite于2026年4月发布最新调查报告,通过Surfer AI检测工具分析65000个网址后得出结论:当前全球互联网上的AI生成内容占比已经正式超越人类原创内容。该工具依托覆盖18年的互联网网页数据库,每月更新30亿至50亿个网页,自2022年ChatGPT发布以来,AI生成内容占比呈现陡增趋势,这一结果也引发了AI行业对创意枯竭与模型发展风险的讨论。

4 小时前
2026年4月,Meta发布由前Scale AI负责人Alexandr Wang团队打造的全新生成式AI模型Muse Spark,该模型推出后迅速拉动旗下Meta AI应用在美国App Store的排名,从发布前的第57位飙升至总榜第5位。据市场机构Appfigures统计,发布首日Meta AI在美国iOS平台下载量达4.6万次,较前一日涨幅达到87%,引发AI消费端市场的广泛关注。

5 小时前
2026年4月10日,小米官方宣布旗下自研MiMo-V2系列大模型正式接入全球顶级开源Agent框架Hermes Agent,开发者更新框架至最新版本后,即可通过Nous Portal直接调用该系列Pro、Omni、Flash三款核心模型。小米同步开启为期14天的开发者限免活动,覆盖全系列模型调用额度,降低Agent应用开发门槛。

5 小时前
2026年4月,腾讯Robotics X实验室联合腾讯混元团队正式推出专为具身智能打造的HY-Embodied-0.5基础模型,在22项行业通用具身评测中拿下16项最优成绩刷新纪录。该系列模型从架构到训练范式全链路重构,同步推出MoT-2B、MoE-32B两款主力模型,可填补通用视觉语言模型三维空间感知与物理交互能力短板,推动大模型向机器人控制领域延伸。

5 小时前
2026年4月披露的行业消息显示,字节跳动2023年成立的AI核心研发部门Seed团队近一年流失近70名技术人才,人员流向腾讯、阿里等头部大厂及AI初创企业,其中近30人入职腾讯负责AI Infra与数据基建,顶级实习生葛浩转投阿里通义千问团队参与强化学习基建研发。该团队研发的豆包大模型此前已支撑50余个应用场景,人员变动凸显国内大模型赛道人才竞争已进入白热化阶段。

6 小时前
2026年4月,谷歌正式为旗下Gemini AI聊天机器人上线交互式3D模型与模拟功能,目前仅面向Gemini Pro用户开放。用户通过指定指令即可生成可操作三维内容、支持参数调整的动态模拟,替代传统文本与静态图示,覆盖物理推演、分子观测、天文模拟等多类科学学习场景,大幅降低复杂概念的理解门槛。

9 小时前
2026年4月,DeepSeek创始人梁文锋确认,新一代旗舰大模型DeepSeek V4将于当月下旬正式发布。此前DeepSeek已上线分层模式设计,快速模式主打即时响应支持多模态识别,专家模式专注复杂逻辑任务。近期平台出现连续服务异常、最长12小时崩溃,业内普遍认为是新旧模型迭代的正常阵痛。