少找工具,多做创作

谷歌推出Gemini任务自动化Beta 移动端AI助手可跨应用代办事务

2026年3月13日,谷歌正式推出基于Gemini大模型的任务自动化功能并开启Beta测试。该功能打破传统AI助手仅能信息查询的局限,无需与第三方应用做定向API对接,即可通过虚拟窗口模拟人类操作,跨应用完成订餐、打车等复杂事务,关键操作节点设置人工复核机制,标志着消费级AI助手迎来重要升级。

早上赶早班机的你对着手机说一句“帮我打个车去首都机场T3航站楼,再点一杯热馥芮白和牛角包送到上车点”,不需要手动切换两个APP挨个操作,你能亲眼看到屏幕自动跳转、滑动、点选,几分钟后就能收到打车和点单的确认通知——这不是科幻作品中的畅想,而是谷歌最新落地的Gemini功能已经能实现的真实体验。

过去十余年间,语音AI助手已经完成了从高端机标配到全品类智能设备普及的渗透,全球范围内的月活跃用户规模突破20亿,但始终没能突破“信息查询工具”的定位。受限于第三方应用的权限开放意愿、API对接的高额成本,此前的AI助手仅能完成设置闹钟、查询天气等简单指令,涉及多步骤、跨应用的复杂需求始终无法落地,用户的实际使用率长期处于低位。

本次上线的Gemini任务自动化功能,核心逻辑完全区别于此前的API对接模式:系统会在独立的虚拟沙箱窗口中模拟人类的触屏操作,不需要调用第三方应用的专属接口就能完成全流程操作

从目前披露的测试场景来看,用户给出“打车去机场”的指令后,AI会自动唤起Uber,识别到多航站楼选项时会主动向用户确认,确认后自动填入目的地;处理“点一杯Flat White和牛角包”的需求时,AI会自主滑动星巴克的菜单寻找对应单品,甚至能匹配用户常用的口味偏好、收货地址。

为了规避自主权带来的安全风险,谷歌也设置了严密的复核机制:所有涉及支付、隐私授权的关键节点,都会强制弹出人工确认窗口,只有用户主动授权后流程才会继续推进,从根本上避免AI私自操作带来的财产、隐私损失。

在不少行业观察者看来,Gemini任务自动化功能的落地,是AI代理(Agent)概念首次面向普通消费级用户实现可用级别的落地,彻底打破了大模型“只能说不能做”的刻板印象。

据了解,目前该功能仅面向美国区的Pixel系列手机用户开放小范围Beta测试,谷歌计划在2026年第二季度逐步扩大测试范围,下半年向全安卓品牌开放相关能力,后续还将推出开发者接口,支持垂直场景的定制化自动化流程,差旅一键预订、学生教务操作、职场办公处理等场景都将逐步实现AI代办。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创