登录体验完整功能(收藏、点赞、评论等)

谷歌低调上线iOS离线AI听写应用 搭载自研Gemma大模型

2026年4月,谷歌低调推出面向iOS系统的离线优先AI听写应用,该产品搭载谷歌自研Gemma轻量化大模型,无需联网即可完成高准确率语音转文字操作,目前已在美区App Store开放下载,直接对标当前听写工具市场头部产品Wispr Flow,被视为谷歌在C端AI工具赛道针对苹果生态的重要布局。

不少用户都有过类似经历:在信号屏蔽的会议室、地下通勤线路或是境外无网环境下,需要记录谈话内容时,依赖云端算力的听写工具直接陷入瘫痪,甚至还会出现语音数据上传泄露的隐私风险。谷歌此次推出的离线听写应用,正是瞄准了这一长期未被满足的用户痛点。

当前全球语音转文字工具市场规模已经突破32亿美元,其中Wispr Flow凭借多场景适配、高准确率的特性,占据了欧美消费级市场近38%的份额。但包括Wispr Flow在内的主流产品,高阶转写功能大多依赖云端算力,离线模式不仅需要付费解锁,识别准确率也比云端版本低20%以上,无法满足专业用户的需求。

同时,近年来全球用户对语音数据隐私的关注度持续提升,超过62%的办公用户明确表示不愿意将涉密谈话内容上传至第三方云端,端侧离线听写的市场需求正在快速上涨。

此次谷歌听写应用的核心竞争力,来自对自研Gemma轻量化大模型的定制化适配。技术参数显示,该应用搭载的语音专属Gemma模型参数规模仅为7B,经过剪枝、量化优化后可直接在iPhone A17及以上芯片上本地运行,**离线状态下通用场景识别准确率可达92%,仅比云端同规格模型低2个百分点**,远高于行业平均水平。

除此之外,该应用还支持自动区分说话人、识别标点与语气停顿、一键生成纪要大纲等此前仅云端工具具备的功能,且全部操作均在本地完成,不会上传任何语音数据,彻底解决了用户的隐私顾虑。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创