谷歌推出离线AI听写应用Eloquent 端侧大模型重构速录体验

AI创作导航 1 个月前

风向

2026年4月7日，谷歌正式在iOS平台推出全离线语音听写应用Google AI Edge Eloquent，该产品基于谷歌自研轻量化大模型Gemma构建，可实现100%本地处理语音数据，无需联网即可完成转录、自动剔除语气词、文本润色等功能，既解决了高敏感场景的隐私泄露风险，也填补了离线语音转录智能优化的市场空白。

图源: 图像由AI生成

对于经常需要记录会议、采访的职场人而言，语音转写工具的“两难问题”已经存在多年：在线转写怕泄露敏感内容，离线转写又往往输出一堆夹杂语气词的不通顺文本，后续整理成本极高。谷歌此次推出的新产品，直接瞄准了这一长期未被满足的市场需求。

传统语音转写工具分为两类，一类依托云端大模型能力，转写准确率和润色能力出色，但所有音频、文本数据都需要上传至服务器，对于商务谈判、内部战略会、深度访谈等高敏感场景，用户往往不敢轻易使用；另一类为纯离线工具，仅依托基础的自动语音识别（ASR）技术完成转写，输出内容基本是“原汁原味”的口头表达，充斥着“嗯、啊、那个、然后”等无意义助词，平均每小时转录内容需要用户花费20-30分钟时间调整润色，效率提升十分有限。

Eloquent的核心优势，是首次把轻量化大模型的理解能力完全落地到了端侧运行。该应用基于谷歌2024年推出的开源轻量化大模型Gemma定制优化，用户仅需要下载不足200M的ASR模型包，即可实现100%离线运行，所有音频处理、文本生成环节都在本地设备完成，完全不会产生数据上传行为，从技术层面堵上了隐私泄露的可能性。

语音识别谷歌离线AI Gemma Eloquent

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

千音漫语

一站式智能声音创作服务平台

Meridian Realms

AI沉浸式故事世界构建工具

Loreform

AI生成定制桌游3D可打印微缩

GPT Image Generator

免费在线AI图像生成工具

AI Inspo

一站式多模态AI创意生成平台

7ART

统一AI身份多模态内容创作平台

WantVideo

4K AI音视频生成创作工具

Wan 3.0 AI Video Generator

AI驱动多模态视频生成工具

谷歌推出离线AI听写应用Eloquent 端侧大模型重构速录体验