2026年4月7日,谷歌正式在iOS平台推出全离线语音听写应用Google AI Edge Eloquent,该产品基于谷歌自研轻量化大模型Gemma构建,可实现100%本地处理语音数据,无需联网即可完成转录、自动剔除语气词、文本润色等功能,既解决了高敏感场景的隐私泄露风险,也填补了离线语音转录智能优化的市场空白。
图源: 图像由AI生成对于经常需要记录会议、采访的职场人而言,语音转写工具的“两难问题”已经存在多年:在线转写怕泄露敏感内容,离线转写又往往输出一堆夹杂语气词的不通顺文本,后续整理成本极高。谷歌此次推出的新产品,直接瞄准了这一长期未被满足的市场需求。
传统语音转写工具分为两类,一类依托云端大模型能力,转写准确率和润色能力出色,但所有音频、文本数据都需要上传至服务器,对于商务谈判、内部战略会、深度访谈等高敏感场景,用户往往不敢轻易使用;另一类为纯离线工具,仅依托基础的自动语音识别(ASR)技术完成转写,输出内容基本是“原汁原味”的口头表达,充斥着“嗯、啊、那个、然后”等无意义助词,平均每小时转录内容需要用户花费20-30分钟时间调整润色,效率提升十分有限。
Eloquent的核心优势,是首次把轻量化大模型的理解能力完全落地到了端侧运行。该应用基于谷歌2024年推出的开源轻量化大模型Gemma定制优化,用户仅需要下载不足200M的ASR模型包,即可实现100%离线运行,所有音频处理、文本生成环节都在本地设备完成,完全不会产生数据上传行为,从技术层面堵上了隐私泄露的可能性。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
1 小时前
2026年5月,谷歌正式面向全球Pixel智能手机用户推送AI个性化图标功能,依托自研生成式AI图像模型,用户可一键将全桌面应用图标替换为迪斯科球样式,目前该功能已覆盖超过92%的常用第三方应用,上线3天内已有超120万Pixel用户激活使用,引发行业对AI终端个性化赛道的新一轮关注。

12 小时前
2026年谷歌I/O开发者大会推出的Gemini系列按算力计费新规上线后遭遇全球付费用户强烈抵制,大量开发者与内容创作者在Reddit、X等平台集中投诉,不少用户仅高强度使用1-2小时就触发5小时额度冷却限制。谷歌DeepMind团队、AI编程工作区Antigravity总监Varun Mohan近期公开回应,宣布将Gemini Pro、Ultra付费用户的使用额度永久提升3倍,快速平息舆论争议。

19 小时前
近日谷歌全量上线原生AI概览功能,原本传统搜索的网页排序结果被大模型生成的整合内容前置,据用户行为调研机构统计,2026年第一季度谷歌用户对AI生成错误内容、冗余信息的投诉量同比上涨127%,至少6款主打差异化路线的新兴搜索引擎用户量环比增速突破300%,全球搜索赛道迎来近十年最大的变量节点。

1 天前
近期谷歌正式面向消费级市场推出完整的AI代理生态规划,计划2026年年内上线超20款覆盖生活全场景的原生AI代理应用,同时向第三方开发者开放全栈适配接口。不过最新行业调研数据显示,目前仅32%的普通消费者愿意授权AI代理处理个人事务,这套酝酿已久的新生态落地前景仍存在不小的不确定性。

1 天前
2026年5月21日谷歌正式宣布推出AI原生编程开发工具AI Studio的Android版本,目前该产品已在Google Play应用商店开启全区域预注册通道。这款面向零基础新手和资深开发者的智能开发工具,依托大模型驱动的智能提示能力大幅简化应用搭建流程,打破传统PC端开发的场景限制,有望进一步扩大移动端开发人群基数。

1 天前
全球科技巨头谷歌正式推出原生AI驱动的信息代理产品,该工具可在后台自动监控用户自定义的各类主题,主动向用户推送相关内容的最新变动,无需用户反复手动发起搜索。这款产品由谷歌搜索团队耗时2年打磨落地,首批开放三大类核心场景测试,年内将逐步向过亿活跃用户开放推送。

1 天前
近日谷歌正式面向全球开发者推出适配AI编码智能体的Android CLI命令行工具,该工具原生支持对接Anthropic旗下Claude Code、OpenAI旗下Codex等主流AI编码平台,可将AI智能体生成安卓应用的链路效率提升47%,打破传统安卓开发IDE对AI助手的功能限制,大幅降低智能体自主完成端侧应用开发的准入门槛。

1 天前
2026年5月19日谷歌正式推出由自研大语言模型能力支撑的Universal Cart通用购物车功能,依托谷歌全域AI消费推荐体系,覆盖用户多设备、多零售平台、跨天数的完整购物决策链路,解决跨站点选购时购物数据不同步、选品进度丢失的普遍痛点,预计上线后可将用户跨平台购物完成率提升47%,覆盖超10亿谷歌消费服务用户。