登录体验完整功能(收藏、点赞、评论等)

谷歌低调上线iOS端离线AI听写应用 搭载自研Gemma大模型

2026年4月,谷歌低调推出面向iOS系统的离线优先AI听写应用,该产品搭载谷歌自研轻量级开源大模型Gemma,主打无网络环境下高准确率语音转写功能,直指当前听写赛道头部产品Wispr Flow,是谷歌在C端AI工具轻量化落地的最新动作,填补了其移动端离线语音交互产品的布局空白。

AI生成配图图源: 图像由AI生成

经常在地铁、地下停车场等信号盲区需要记录会议内容、采访素材的用户,如今多了一个新的工具选择。近日不少iOS用户发现,苹果应用商店已经上架了谷歌推出的全新听写应用,该应用在介绍页最醒目的位置标注了「离线可用」标识,下载量在上线一周内已经突破10万次。

此前主流语音转写工具大多依赖云端算力,用户必须在网络稳定的环境下才能获得较好的转写效果,一旦断网要么完全无法使用,要么准确率下降超过30%。过去两年,面向创作者、职场人的垂直听写工具需求增速超过200%,其中Wispr Flow凭借稳定的离线转写功能,已经积累了超过2000万全球用户,是当前赛道的头部玩家。

这款新应用的核心能力来自谷歌2024年推出的轻量级开源大模型Gemma,不同于谷歌面向通用场景的PaLM大模型,Gemma的参数规模更小,专门针对端侧部署做了优化。**在语音转写场景下,该应用离线状态下的中文、英文转写准确率均超过97%,和联网状态下的主流听写工具表现基本持平**,而且所有计算都在本地完成,不会上传用户的语音数据到云端,隐私安全性远高于同类联网产品。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创