少找工具,多做创作

谷歌启动macOS版Gemini内测 拟上线桌面智能功能补全AI生态

2026年3月,谷歌正式启动macOS版Gemini原生应用早期Beta测试,本次测试仅向受邀用户开放,核心将上线“桌面智能”功能,支持AI深度理解屏幕内容上下文交互,同时搭载Nano Banana、Veo等模型满足多媒体生成需求,此举主要为应对ChatGPT、Claude等竞品在Mac桌面端的布局,补全自身AI生态落地场景。

过去两年大模型C端竞争的焦点始终集中在网页端和移动端,但随着办公场景AI需求的持续爆发,桌面原生应用已经成为头部玩家新的必争之地。此前OpenAI、Anthropic均已率先推出Mac原生应用,支持跨应用内容调取、文档识别等功能,在办公场景的用户渗透率远超纯网页端AI工具。而谷歌此前在苹果桌面生态始终仅提供网页版Gemini入口,入口较浅、功能受限的问题长期被用户诟病,市场份额也持续被竞品分流。

本次启动的macOS版Gemini测试目前仅面向受邀用户开放,核心亮点是即将上线的“桌面智能(Desktop Intelligence)”功能。根据测试版代码显示,该功能将赋予Gemini系统级的屏幕内容理解权限,参考安卓端已经落地的Gemini Live屏幕共享模式,用户无需手动上传截图、文档,直接呼出Gemini即可基于当前屏幕显示的内容完成交互——比如总结正在浏览的行业报告核心观点、提取打开的表格数据生成可视化图表、基于PPT草稿优化内容逻辑等。

除此之外,参与测试的用户已经可以调用Nano Banana、Veo、Lyria等多个细分模型,完成图文、视频、音频等不同类型的多媒体内容创作。作为原生桌面应用,macOS版Gemini支持全局快捷键唤醒,无需跳转浏览器即可调用,响应速度较网页版有明显提升。

从谷歌的AI布局来看,本次macOS版Gemini的测试只是其补全桌面生态的第一步。据了解,谷歌后续还将推出Windows版原生Gemini应用,同时打通网页端、移动端、桌面端的用户数据与使用上下文,实现多端场景的无缝衔接,比如用户在手机端生成的内容大纲,在桌面端打开即可直接结合本地文件继续优化。

当前大模型行业的竞争已经从参数规模的比拼转向落地场景的覆盖,谁能抢占更多用户高频使用的场景入口,谁就能在C端市场获得更稳固的用户粘性。谷歌此次加快桌面端AI产品的落地,也意味着接下来头部玩家在桌面办公场景的竞争会进一步加剧。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创