Google宣布旗下Gemini AI助手正式在Android平台新增多步骤任务自动化功能,支持自动完成网约车呼叫、杂货采购及外卖配送等多环节操作,用户只需通过自然语言下达指令,即可实现需求提出到任务落地的全流程闭环,大幅简化移动端复杂任务的操作门槛。
当你早上出门发现没买早餐,或是临时需要叫车去高铁站时,无需再逐个打开APP、填写信息、确认订单,只需对着Android手机说出需求,Gemini就能帮你完成全部操作——2月25日,Google正式推送了这一面向Android平台的Gemini功能更新,将AI助手的能力从“问答”延伸至“执行”。
Google官方披露,此次Gemini新增的多步骤任务自动化功能,首批聚焦于网约车、杂货配送、外卖下单三大高频生活服务场景。这些场景往往需要用户完成至少3个以上的操作步骤,比如呼叫网约车需经历“打开APP-输入地址-选择车型-确认呼叫”,而Gemini通过深度整合Android系统权限与第三方应用接口,可将这些步骤压缩为“一句指令+自动执行”的模式。
为保障用户权益,Gemini在执行支付类任务(如外卖下单)时,会在最终支付环节暂停并向用户发起确认,避免因指令理解偏差导致的误操作,平衡自动化效率与使用安全性。
近年来,全球AI助手市场已从早期的语音问答、信息查询,转向更具实用性的场景化任务执行。OpenAI的ChatGPT移动端已支持与部分办公、生活类APP联动,苹果Siri也通过“快捷指令”功能实现简单任务自动化,但Gemini此次的更新更注重全流程闭环体验。
依托Google在Android生态的主导地位,Gemini能更顺畅地调用系统底层能力与第三方应用的核心功能模块,无需用户额外设置复杂的快捷指令,仅凭自然语言就能触发多步操作——这一点成为Gemini相较于竞品的差异化优势,也进一步巩固了Google在移动端AI领域的布局。
Gemini实现多步任务自动化的核心在于两大支撑:一是其自身的大语言模型对自然语言指令的精准解析能力,能快速提炼用户需求中的关键信息(如目的地、商品偏好、时间要求);二是与Android系统的深度集成,确保AI助手能安全、合规地调用第三方应用的功能接口。
Google方面表示,未来会根据用户反馈拓展更多任务场景,比如日程管理中的多APP联动、办公文档的自动化处理等,同时也会开放接口吸引更多第三方开发者适配,打造覆盖全生活、办公场景的AI自动化生态。