苹果推出3B参数端侧AI模型 Ferret-UI Lite精准读懂手机UI

2 小时前 AI快讯 2

苹果推出3B参数端侧AI模型 Ferret-UI Lite精准读懂手机UI

2月21日,苹果研究团队在最新学术论文中披露一款专为移动设备打造的端侧AI模型Ferret-UI Lite。这款模型仅拥有30亿(3B)参数,属于典型的轻量级端侧模型,却在多项UI理解与交互基准测试中,性能匹配甚至超越了体积大24倍的大型云端模型,为算力有限的手机设备带来了复杂界面精准交互的新可能。

在AI大模型动辄百亿、千亿参数的当下,苹果选择深耕轻量级端侧模型的路径,显得格外有针对性。Ferret-UI Lite是一款面向图形用户界面(UI)的多模态大语言模型,其核心定位就是在iPhone这类算力有限的移动设备上本地运行,无需依赖云端服务器。这不仅能避免用户交互数据上传云端带来的隐私风险,还能实现毫秒级的响应速度,让AI交互更流畅自然——用户发出指令的瞬间,模型就能在本地完成界面分析与操作执行,完全不受网络环境影响。

最引人注目的是Ferret-UI Lite的“以小博大”性能表现。根据苹果研究团队的测试数据,这款3B参数的小模型,在UI元素识别、自然语言指令执行、复杂界面理解等核心任务上,得分与拥有72亿参数的大型模型持平,部分场景甚至实现超越。要知道,后者的参数体量是Ferret-UI Lite的24倍,训练与推理所需的算力资源更是呈指数级增长。这种突破背后,是苹果针对UI场景的多层专项优化:研究团队构建了覆盖数千款移动应用的UI交互数据集,包含按钮、弹窗、滑块、数据面板等近百种UI元素的交互逻辑;通过知识蒸馏技术,将大型模型的UI理解能力压缩迁移到轻量级框架中;同时适配了苹果A系列芯片的神经引擎架构,让模型推理效率进一步提升,在iPhone上的运行延迟控制在1秒以内。

近年来,端侧AI逐渐成为科技行业的核心赛道之一。相较于云端AI,端侧AI在隐私保护、响应速度、离线使用等方面具备天然优势,但受限于移动设备的算力瓶颈,此前多数端侧AI模型只能处理简单的语音转文字、图像分类任务,难以支撑复杂的UI交互需求。苹果此次推出的Ferret-UI Lite,恰好填补了这一空白。一位AI行业分析师指出,UI是用户与移动设备交互的核心入口,能够精准理解并操作UI的端侧AI,将彻底改变用户与手机的互动方式——从手动点击的“精准操作”,转向自然语言驱动的“全域控制”,这对老年用户、残障人士的设备使用体验提升尤为明显。

具体来看,Ferret-UI Lite的应用场景十分广泛:用户无需在设置菜单中层层查找,只需说出“帮我开启低电量模式并关闭后台刷新”,模型就能精准定位对应选项并执行操作;在电商APP中,用户可以指令“筛选出价格在300-800元之间、支持降噪的TWS耳机”,模型会自动识别界面上的筛选栏、价格滑块完成操作;甚至面对股票APP中同时包含K线图、数据面板、交易按钮的复杂界面,模型也能精准理解“显示过去7天的成交量变化并添加到自选列表”这类复合指令。

目前Ferret-UI Lite仍处于学术研究阶段,尚未明确何时会集成到iOS系统或苹果官方应用中,但这一研究成果无疑释放了苹果深耕端侧AI的明确信号。随着移动设备算力的持续提升,以及轻量级AI模型技术的不断成熟,未来用户或许能在iPhone上体验到更智能、更便捷的全域AI交互,而苹果的这次探索,也为整个行业提供了轻量级端侧AI模型的优化范本。

所属分类
×

微信二维码

请选择您要添加的方式

AI小创