少找工具,多做创作

谷歌Gemini上线任务自动化功能 AI助手可代操作手机点外卖办业务

2026年3月24日,谷歌正式面向Pixel10Pro、Galaxy S26Ultra两款旗舰机型推送Gemini任务自动化功能(Task Automation),该功能打破传统AI助手仅能实现对话交互的边界,可直接接管手机屏幕完成应用启动、界面识别、表单填写、订单确认等全流程操作,实测可独立完成DoorDash外卖下单,标志着AI助手正式从对话工具升级为执行代理(Agent)

在OSCHINA最新披露的实测案例中,用户仅对手机说出“帮我点一份30元以内的美式汉堡外卖”的自然语言指令,Gemini便自动启动DoorDash应用,依次完成配送地址确认、餐品筛选、优惠券勾选、支付方式选择等操作,全程无需用户触碰屏幕。

最具突破性的是任务的异步运行能力:执行过程中用户可以随时切换到其他APP刷视频、回消息,Gemini会在后台持续推进任务,仅在屏幕底部实时显示操作进度,避免打扰用户当前操作。目前该功能仍存在速度短板,全流程操作耗时约为人工操作的1.5-2倍,谷歌官方表示后续将通过端侧算力优化逐步提升运行效率。

针对用户关注的安全问题,谷歌明确表示所有涉及支付、隐私授权的操作都会触发人工核验流程,Gemini不会擅自完成支付或授权操作,保障用户数据和资金安全。

此前消费级AI助手始终停留在“问答工具”阶段,用户即便得到AI给出的操作指引,仍需要手动完成后续步骤,而企业端应用的RPA(机器人流程自动化)又需要针对特定软件做定制化适配,无法覆盖普通消费者的碎片化场景。

本次Gemini推出的任务自动化功能是首个面向C端用户的通用型AI执行代理,无需第三方APP做针对性适配,就能覆盖外卖下单、票务购买、信息填报等绝大多数日常手机使用场景,这一功能的落地也标志着AI Agent从行业概念正式走进普通消费者的日常生活。目前该功能仅对两款旗舰机型开放灰度测试,预计2026年第二季度将覆盖所有搭载安卓15系统的主流机型。

Gemini本次功能更新也拉开了C端AI代理赛道竞争的序幕,据行业人士透露,OpenAI正在研发GPT的移动端操作功能,国内厂商DeepSeek、字节跳动豆包也在布局相关技术,预计2026年下半年将有更多同类产品上线。

随着AI执行代理技术的成熟,未来用户使用智能设备的逻辑将被彻底重构:不再需要记忆不同APP的操作路径,仅靠自然语言指令就能完成绝大多数操作,老人、视障群体等使用智能设备有障碍的群体,也能享受到移动互联网的便利。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创