谷歌近期正在推进端侧轻量化大模型Gemini Nano 4的终端适配工作,预计2025年第一季度发布的下一代安卓旗舰机型将率先搭载该模型。其端侧推理性能较上一代提升62%,支持离线语音交互、实时图像生成等12项新增本地AI功能,无需上传数据至云端即可完成运算,在隐私安全性、响应速度上均有显著提升。
近两年,端侧AI已经成为高端智能手机的核心竞争点,苹果在iPhone 16系列搭载的Apple Intelligence、高通骁龙8 Gen3内置的Hexagon NPU AI引擎,都在试图把更多大模型运算放在本地完成,避免云端传输带来的延迟和隐私风险,但目前主流移动端端侧模型的算力上限,仍然限制了复杂功能的落地。
不同于ChatGPT等云端大模型,端侧大模型的所有运算都在设备本地完成,不会产生数据传输。调研数据显示,超过7成的高端手机用户表示,愿意为“不联网即可使用AI功能”付费,尤其是涉及聊天记录、个人照片、工作文档的处理场景,用户对数据上传云端的敏感度极高。
但当前安卓阵营搭载的Gemini Nano 3,仅能支持简单的语音助手唤醒、短文本摘要等基础功能,稍微复杂的图像生成、长文档处理仍然需要跳转云端,响应延迟普遍超过2秒,使用体验大打折扣,无法满足用户的高频需求。
作为谷歌专为移动端打造的轻量化大模型,Gemini Nano系列一直是安卓端侧AI的核心支撑,本次迭代的Gemini Nano 4实现了核心参数的大幅升级:推理速度较上一代提升62%,运行同等任务的功耗降低28%,同时支持的端侧功能从原来的5项扩展到17项,包括离线多语种实时翻译、4K视频智能剪辑、本地生成长图、隐私对话加密处理等,甚至可以在完全断网的情况下完成300页PDF文档的摘要提取,响应速度不超过1秒。
谷歌AI团队负责人表示,Gemini Nano 4采用了全新的参数压缩技术,在保留90%以上通用大模型能力的前提下,把模型体积控制在10GB以内,完全可以在旗舰手机的本地存储和NPU上流畅运行,不会额外占用过多硬件资源,也不会导致手机续航明显下降。对普通用户而言,未来在海外旅行时不用购买本地电话卡,就可以通过本地模型完成实时的菜单翻译、路牌识别,不会产生数据漫游费用,也不用担心行程信息上传云端泄露。
目前三星、小米、vivo等头部安卓厂商均已启动Gemini Nano 4的适配工作,预计2025年第一季度发布的新一代旗舰机型将全部首发搭载该模型,部分厂商还会基于Gemini Nano 4开发定制化功能,比如小米的小爱同学本地全功能、三星的Bixby离线办公助手等。
业内分析认为,随着Gemini Nano 4的落地,安卓阵营的端侧AI能力将首次实现对苹果的反超,而未来2-3年,端侧大模型的迭代速度会进一步加快,甚至有可能成为手机产品最核心的差异化卖点,直接影响高端市场的份额格局。

(图像由AI生成)

4 小时前
2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。

5 小时前
2026年4月3日,Cursor团队正式推出代码编辑器Cursor 3版本,核心搭载智能体统一工作区,支持多智能体协同、本地与云端多代码仓库无缝切换,开发者可通过多终端启动智能体,将软件开发模式从传统人机协作升级为智能体自主工作阶段,可大幅降低跨环境开发的沟通与操作成本。

6 小时前
2026年4月3日,谷歌正式发布Gemini API全新定价策略,新增标准、弹性、优先、批量、缓存五大服务档位,其中弹性、批量档位推理成本较标准档直降50%,分别适配延迟容忍度1-15分钟、最长24小时的非实时场景,可满足不同开发者从实时调用到大规模离线处理的多元算力需求。

6 小时前
2026年4月3日,谷歌DeepMind正式发布新一代开源大模型系列Gemma4,本次迭代距上一代产品发布间隔一年,不仅将开源协议更换为支持免费商用的Apache2.0,还推出4款覆盖端侧到数据中心的不同规格产品,其中310亿参数旗舰版性能位列Arena AI开源排行榜第三,单张H100显卡即可运行。

7 小时前
近期微软调整旗下AI业务核心战略,从此前依赖OpenAI GPT系列技术支撑Copilot等智能产品,转向投入超110亿美元搭建自研大模型团队,目标在2025年底前推出完全自主可控的通用AI底座,替代现有外采技术方案,相关调整已覆盖云计算、办公AI、消费级智能助手三大核心业务线。

7 小时前
2026年3月底小米正式面向全球开发者推出自研MiMo大模型首个Token Plan订阅套餐,共设四档月费39元至659元,通过统一Credit点数实现多模型多模态调用透明计费。旗下MiMo-V2-Pro模型以万亿参数、百万上下文窗口位列全球大模型评测第五,目前MiMo系列周调用量已突破4万亿Token,此举标志小米AI商业化进入规模化交付阶段。

7 小时前
2026年4月3日滴滴公开最新运营数据,其旗下AI出行助手“小滴”近一周活跃用户较年初增长37倍,00后用户占比超40%。2026年清明假期全国交通枢纽打车需求预计同比上涨239%、异地用车需求增近40%,滴滴依托大模型技术升级调度体系,推动出行服务从“打到车”向“打对车”升维。

12 小时前
2026年4月消息,谷歌联合能源公司Crusoe Energy在美国得克萨斯州阿姆斯特朗县投建装机容量933兆瓦的天然气发电厂,为其Goodnight AI数据中心园区供电,项目已于今年1月提交许可并启动建设。电厂投用后年碳排放预计达450万吨,该举动引发行业对谷歌2030年零碳运营承诺能否兑现的广泛质疑。