2026年6月25日,谷歌DeepMind正式宣布为旗下大语言模型Gemini 3.5 Flash集成原生计算机使用能力,开发者可依托单一模型构建支持浏览器、手机、桌面端跨平台操作的AI智能体,无需再进行多模型切换与上下文传递,可大幅降低复杂长任务的中途失败概率,显著简化AI智能体的开发流程。

在此次升级前,计算机操作能力一直作为独立模型单独提供,开发者要搭建一个能跨设备执行任务的AI智能体,往往需要同时调用推理、视觉识别、操作执行等多个不同模型,仅不同模型间的上下文同步逻辑就要占整体开发工作量的一半以上。
过去两年AI智能体的商业化落地一直不及预期,行业调研显示,近6成开发者认为多模型切换的上下文丢失是导致智能体任务失败的首要原因。尤其是涉及跨设备的长周期任务,比如帮用户完成“查询当月账单-生成报销表格-同步到企业OA系统”的流程,中间需要切换至少3个不同的模型模块,任何一次上下文传递出错都会导致任务中断,需要用户反复确认,体验极差。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录