苹果推出3B参数端侧AI模型 Ferret-UI Lite精准读懂手机UI
2月21日,苹果研究团队在最新学术论文中披露一款专为移动设备打造的端侧AI模型Ferret-UI Lite。这款模型仅拥有30亿(3B)参数,属于典型的轻量级端侧模型,却在多项UI理解与交互基准测试中,性能匹配甚至超越了体积大24倍的大型云端模型,为算力有限的手机设备带来了复杂界面精准交互的新可能。
在AI大模型动辄百亿、千亿参数的当下,苹果选择深耕轻量级端侧模型的路径,显得格外有针对性。Ferret-UI Lite是一款面向图形用户界面(UI)的多模态大语言模型,其核心定位就是在iPhone这类算力有限的移动设备上本地运行,无需依赖云端服务器。这不仅能避免用户交互数据上传云端带来的隐私风险,还能实现毫秒级的响应速度,让AI交互更流畅自然——用户发出指令的瞬间,模型就能在本地完成界面分析与操作执行,完全不受网络环境影响。
最引人注目的是Ferret-UI Lite的“以小博大”性能表现。根据苹果研究团队的测试数据,这款3B参数的小模型,在UI元素识别、自然语言指令执行、复杂界面理解等核心任务上,得分与拥有72亿参数的大型模型持平,部分场景甚至实现超越。要知道,后者的参数体量是Ferret-UI Lite的24倍,训练与推理所需的算力资源更是呈指数级增长。这种突破背后,是苹果针对UI场景的多层专项优化:研究团队构建了覆盖数千款移动应用的UI交互数据集,包含按钮、弹窗、滑块、数据面板等近百种UI元素的交互逻辑;通过知识蒸馏技术,将大型模型的UI理解能力压缩迁移到轻量级框架中;同时适配了苹果A系列芯片的神经引擎架构,让模型推理效率进一步提升,在iPhone上的运行延迟控制在1秒以内。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
7 天前
2026年3月31日,谷歌DeepMind正式推出旗下目前定价最亲民的AI视频生成模型Veo 3.1 Lite。该模型生成速度与此前发布的Veo 3.1 Fast版本持平,生成成本不到后者的一半,720P分辨率视频生成成本低至每秒0.05美元,支持文生视频、图生视频两大核心功能,大幅降低了AI视频创作的准入门槛。

8 天前
2026年4月,谷歌正式推出AI视频生成家族新成员Veo 3.1 Lite轻量化模型,通过架构优化大幅压缩算力成本,720P分辨率视频生成成本低至每秒0.05美元,在保留画面光影、运动还原能力的前提下,对标市面同类轻量化产品,主打高性价比路线,面向中短视频创作者、小型开发团队降低AI视频生成准入门槛。

1 个月前
2月28日,金融时报(FT)独家消息,AI公司深度求索(DeepSeek)将于下周推出全新多模态大语言模型V4,这是该公司自2025年1月发布R1推理模型后的首个重大版本更新。该模型原生支持图片、视频与文本生成功能,有望填补国内低成本、开源多模态模型的市场缺口。

20 分钟前
美国科技公司谷歌今日正式宣布,旗下主打个人知识管理的AI工具NotebookLM已嵌入Gemini笔记模块,全球全量Gemini用户即日起可在Gemini生态内直接调用NotebookLM的长文本处理、资料问答、结构化内容生成等功能,无需切换独立入口。此次整合是谷歌强化Gemini产品矩阵竞争力、对抗OpenAI ChatGPT等竞品的重要布局,预计将覆盖全球超1亿Gemini活跃用户。

50 分钟前
2026年4月9日,腾讯云正式上线AI助手QClaw V2版本,核心搭载多Agent协同与跨应用直连技术,支持最多3个自定义或内置专业角色Agent并行处理任务,可直连腾讯文档、Notion、邮箱等主流办公工具,大幅降低复杂任务处理误差,解决传统单AI的记忆遗漏、响应偏差等痛点,同时内置专属安全管控机制保障用户数据隐私。

1 小时前
2026年4月9日,AI大模型企业Anthropic正式推出面向B端用户的生产级智能体托管平台Claude Managed Agents。该产品可将原本需要工程团队耗费数月完成的智能体底层基础设施搭建工作压缩至数天,大幅降低企业部署AI智能体的技术门槛与人力成本,为AI智能体的规模化落地提供了新的标准化解决方案。

1 小时前
2026年4月8日腾讯云正式发布国内首个浏览器智能体“龙虾”QBotClaw,该产品将AI Agent能力原生集成于QQ浏览器,支持用户通过自然语言指令完成复杂操作,零配置免费使用,可自定义接入主流大模型,还首创微信远程操控功能,目前Mac版本已上线,Windows版本即将推出。

1 小时前
2026年4月微信支付正式上线专为商家与开发者打造的AI原生接入工具箱,核心包含Skill技能包、AI友好文档、AI友好API三大模块,支持主流AI开发工具一键加载,无代码基础的小微商家仅需数分钟即可开通线上支付功能,原本数天的接入开发流程缩短90%以上,全面覆盖20余种常用支付场景。