登录体验完整功能(收藏、点赞、评论等)

谷歌推出离线AI听写应用Eloquent 端侧大模型重构速录体验

2026年4月7日,谷歌正式在iOS平台推出全离线语音听写应用Google AI Edge Eloquent,该产品基于谷歌自研轻量化大模型Gemma构建,可实现100%本地处理语音数据,无需联网即可完成转录、自动剔除语气词、文本润色等功能,既解决了高敏感场景的隐私泄露风险,也填补了离线语音转录智能优化的市场空白。

AI生成配图图源: 图像由AI生成

对于经常需要记录会议、采访的职场人而言,语音转写工具的“两难问题”已经存在多年:在线转写怕泄露敏感内容,离线转写又往往输出一堆夹杂语气词的不通顺文本,后续整理成本极高。谷歌此次推出的新产品,直接瞄准了这一长期未被满足的市场需求。

传统语音转写工具分为两类,一类依托云端大模型能力,转写准确率和润色能力出色,但所有音频、文本数据都需要上传至服务器,对于商务谈判、内部战略会、深度访谈等高敏感场景,用户往往不敢轻易使用;另一类为纯离线工具,仅依托基础的自动语音识别(ASR)技术完成转写,输出内容基本是“原汁原味”的口头表达,充斥着“嗯、啊、那个、然后”等无意义助词,平均每小时转录内容需要用户花费20-30分钟时间调整润色,效率提升十分有限。

Eloquent的核心优势,是首次把轻量化大模型的理解能力完全落地到了端侧运行。该应用基于谷歌2024年推出的开源轻量化大模型Gemma定制优化,用户仅需要下载不足200M的ASR模型包,即可实现100%离线运行,所有音频处理、文本生成环节都在本地设备完成,完全不会产生数据上传行为,从技术层面堵上了隐私泄露的可能性。

!
本文内容来源于公开互联网信息,并包含平台新增内容及用户发布内容,旨在进行知识整理与分享。文中所有信息与观点均仅供参考,不代表任何官方或特定立场,亦不构成任何操作或决策建议,请读者谨慎甄别,详情请见完整免责声明
相关资讯
AI小创