谷歌近期正在推进端侧轻量化大模型Gemini Nano 4的终端适配工作,预计2025年第一季度发布的下一代安卓旗舰机型将率先搭载该模型。其端侧推理性能较上一代提升62%,支持离线语音交互、实时图像生成等12项新增本地AI功能,无需上传数据至云端即可完成运算,在隐私安全性、响应速度上均有显著提升。
近两年,端侧AI已经成为高端智能手机的核心竞争点,苹果在iPhone 16系列搭载的Apple Intelligence、高通骁龙8 Gen3内置的Hexagon NPU AI引擎,都在试图把更多大模型运算放在本地完成,避免云端传输带来的延迟和隐私风险,但目前主流移动端端侧模型的算力上限,仍然限制了复杂功能的落地。
不同于ChatGPT等云端大模型,端侧大模型的所有运算都在设备本地完成,不会产生数据传输。调研数据显示,超过7成的高端手机用户表示,愿意为“不联网即可使用AI功能”付费,尤其是涉及聊天记录、个人照片、工作文档的处理场景,用户对数据上传云端的敏感度极高。
但当前安卓阵营搭载的Gemini Nano 3,仅能支持简单的语音助手唤醒、短文本摘要等基础功能,稍微复杂的图像生成、长文档处理仍然需要跳转云端,响应延迟普遍超过2秒,使用体验大打折扣,无法满足用户的高频需求。
作为谷歌专为移动端打造的轻量化大模型,Gemini Nano系列一直是安卓端侧AI的核心支撑,本次迭代的Gemini Nano 4实现了核心参数的大幅升级:推理速度较上一代提升62%,运行同等任务的功耗降低28%,同时支持的端侧功能从原来的5项扩展到17项,包括离线多语种实时翻译、4K视频智能剪辑、本地生成长图、隐私对话加密处理等,甚至可以在完全断网的情况下完成300页PDF文档的摘要提取,响应速度不超过1秒。
谷歌AI团队负责人表示,Gemini Nano 4采用了全新的参数压缩技术,在保留90%以上通用大模型能力的前提下,把模型体积控制在10GB以内,完全可以在旗舰手机的本地存储和NPU上流畅运行,不会额外占用过多硬件资源,也不会导致手机续航明显下降。对普通用户而言,未来在海外旅行时不用购买本地电话卡,就可以通过本地模型完成实时的菜单翻译、路牌识别,不会产生数据漫游费用,也不用担心行程信息上传云端泄露。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 分钟前
2026年4月,国产多模态AI赛道再添新玩家,京东推出全新一体化空间图像编辑大模型JoyAI-Image-Edit,据资深科技作者江宇调研报道,该模型基准评测性能追平谷歌Gemini 2.5 Pro,在空间编辑任务上表现超越主流视频模型。本次京东同步开放开源,结合自身供应链优势推进落地,主打电商内容生成、具身智能训练数据生产场景。

1 小时前
4月10日,外媒The Information援引知情人士消息,首次披露埃隆·马斯克旗下太空企业SpaceX与AI子公司xAI的2025年合并财务数据。这份从未公开的财报显示,SpaceX全年营收超过185亿美元,约合人民币1267亿元,合并口径下净亏损近50亿美元,折合人民币约342亿元,亏损主要来自xAI的大模型研发投入,引发AI行业对前沿研发成本模式的关注。

3 小时前
网络研究机构Graphite于2026年4月发布最新调查报告,通过Surfer AI检测工具分析65000个网址后得出结论:当前全球互联网上的AI生成内容占比已经正式超越人类原创内容。该工具依托覆盖18年的互联网网页数据库,每月更新30亿至50亿个网页,自2022年ChatGPT发布以来,AI生成内容占比呈现陡增趋势,这一结果也引发了AI行业对创意枯竭与模型发展风险的讨论。

4 小时前
2026年4月,Meta发布由前Scale AI负责人Alexandr Wang团队打造的全新生成式AI模型Muse Spark,该模型推出后迅速拉动旗下Meta AI应用在美国App Store的排名,从发布前的第57位飙升至总榜第5位。据市场机构Appfigures统计,发布首日Meta AI在美国iOS平台下载量达4.6万次,较前一日涨幅达到87%,引发AI消费端市场的广泛关注。

4 小时前
2026年4月10日,小米官方宣布旗下自研MiMo-V2系列大模型正式接入全球顶级开源Agent框架Hermes Agent,开发者更新框架至最新版本后,即可通过Nous Portal直接调用该系列Pro、Omni、Flash三款核心模型。小米同步开启为期14天的开发者限免活动,覆盖全系列模型调用额度,降低Agent应用开发门槛。

4 小时前
2026年4月,腾讯Robotics X实验室联合腾讯混元团队正式推出专为具身智能打造的HY-Embodied-0.5基础模型,在22项行业通用具身评测中拿下16项最优成绩刷新纪录。该系列模型从架构到训练范式全链路重构,同步推出MoT-2B、MoE-32B两款主力模型,可填补通用视觉语言模型三维空间感知与物理交互能力短板,推动大模型向机器人控制领域延伸。

5 小时前
2026年4月披露的行业消息显示,字节跳动2023年成立的AI核心研发部门Seed团队近一年流失近70名技术人才,人员流向腾讯、阿里等头部大厂及AI初创企业,其中近30人入职腾讯负责AI Infra与数据基建,顶级实习生葛浩转投阿里通义千问团队参与强化学习基建研发。该团队研发的豆包大模型此前已支撑50余个应用场景,人员变动凸显国内大模型赛道人才竞争已进入白热化阶段。

6 小时前
2026年4月,谷歌正式为旗下Gemini AI聊天机器人上线交互式3D模型与模拟功能,目前仅面向Gemini Pro用户开放。用户通过指定指令即可生成可操作三维内容、支持参数调整的动态模拟,替代传统文本与静态图示,覆盖物理推演、分子观测、天文模拟等多类科学学习场景,大幅降低复杂概念的理解门槛。