2026年4月7日,谷歌正式在iOS App Store上架AI语音转写应用Google AI Edge Eloquent,该应用面向用户免费开放且无使用次数限制,默认搭载本地Gemma ASR模型完成语音识别与文本整理,全程无需联网、数据不流出用户设备,同时支持切换至云端调用Gemini大模型进行文本润色,兼顾隐私安全与转写效果。
打开刚上架的Eloquent应用,用户不需要注册账号,甚至不需要授予网络权限,就能直接开启语音转写功能——这和此前绝大多数需要登录、联网才能使用的同类产品形成了鲜明反差。作为谷歌端侧AI落地C端的最新尝试,这款应用刚上架就吸引了大量办公、学生群体的下载。
语音转写是当下办公、学习场景的高频刚需工具,不管是会议纪要、访谈整理还是课程记录,都有大量用户需求。但长期以来,该赛道的产品普遍存在两个核心痛点:一是收费门槛高,多数工具按转写时长收费,免费版往往有每月1-3小时的额度限制,购买会员的月费普遍在20-50元区间;二是隐私风险突出,绝大多数转写工具需要用户将音频上传至云端服务器处理,不少涉及商业机密、私人信息的内容存在泄露隐患,此前也多次出现过转写平台泄露用户录音的相关事件。
Eloquent的核心竞争力,在于其完全基于端侧大模型搭建的技术架构。谷歌为其搭载了专门优化的**Gemma ASR端侧语音识别模型**,所有语音采样、识别、初步文本整理的过程全部在用户本地设备完成,不需要上传任何音频数据到谷歌服务器,即使用户关闭应用的网络权限,也能正常使用所有基础转写功能,从根源上避免了数据泄露的风险。
针对部分用户对更高转写质量的需求,Eloquent也提供了可选的云端增强功能:用户可以手动选择将初步转写的文本上传至云端,调用Gemini大模型完成专业术语校正、内容结构化整理、语病修正等润色工作,在有需求时进一步提升输出内容的质量。此外应用还支持个性化词汇学习功能,可自动识别用户常用的人名、专业名词、企业名称等内容生成专属词典,进一步提升识别准确率,所有个性化数据同样存储在用户本地。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
23 小时前
2024年下半年以来,全球AI赛道迎来新一轮产品迭代潮:OpenAI下一代大模型GPT-5研发进入收尾阶段,Google Gemini全端覆盖用户突破10亿,苹果Apple Intelligence随新系统正式推送,国内厂商DeepSeek、Perplexity等垂直类AI工具月活涨幅超60%,AI代理、AI PC等新形态应用也从概念走向落地,全行业商业化进程持续提速。

1 天前
2026年5月21日,全球头部流媒体音频服务商Spotify在年度投资者日上,正式推出其AI战略核心载体Studio by Spotify Labs桌面应用。这款搭载全功能AI Agent的生成式音频产品,可打通用户日程、邮箱等多端数据生成个性化音频内容,标志着Spotify从传统音频播放器向生成式音频平台转型,目前该产品研发预览版已在20余个地区开放测试。

1 天前
2026年5月,潮流电商平台得物公开其基于AI Coding工具Claude Code的数仓开发落地实践,团队在将重复性开发工作效率提升超40%的过程中,也定位到长对话上下文遗忘、规则执行稳定性不足两大核心痛点,实测数据显示AI生成SQL的数据偏差最高可达1000倍,为全行业企业级AI开发工具落地提供了极具参考性的真实样本。

1 天前
2026年谷歌I/O开发者大会推出的Gemini系列按算力计费新规上线后遭遇全球付费用户强烈抵制,大量开发者与内容创作者在Reddit、X等平台集中投诉,不少用户仅高强度使用1-2小时就触发5小时额度冷却限制。谷歌DeepMind团队、AI编程工作区Antigravity总监Varun Mohan近期公开回应,宣布将Gemini Pro、Ultra付费用户的使用额度永久提升3倍,快速平息舆论争议。

1 天前
资深科技记者Grace Huckins在2026年5月的行业报道中指出,本届Google I/O大会披露的多项技术进展,清晰呈现出AI驱动科研领域的发展路径正在发生根本性转移。两年前Google旗下DeepMind团队凭借AlphaFold蛋白结构预测工具斩获诺贝尔化学奖,如今行业正朝着更普适的通用科研AI体系加速突进。

1 天前
近日谷歌旗下通用大模型产品Gemini被曝出此前曾在正式对外服务的生产环境中出现核心调度模块崩溃故障,谷歌运维团队尚未介入处置时,Gemini已自主生成修复代码完成全链路故障恢复。该事件由谷歌AI核心研发负责人Demis Hassabis在内部技术分享中披露,目前多家全球AI行业研究机构已针对大模型自主运维能力展开专项测算。

1 天前
近日阿里巴巴旗下大模型业务线通义千问正式推出全新推理Agent模型Qwen3.7-Max,这款产品搭载最高100万Token的长上下文窗口,在第三方权威测评Artificial Analysis Intelligence Index中拿到56.6的高分,大幅刷新了同级别推理Agent模型的性能基准,为复杂长文档处理、多步骤任务自主执行场景提供了全新的落地方案。

1 天前
谷歌近期正式面向全球市场推送Google Health 5.0版本,首次将Google Gemini大模型驱动的智能健康助手放在首屏核心位置,该更新覆盖全球27个地区超1.2亿活跃安卓用户,功能响应速度较上代提升72%,但产品方并未在公开更新日志中提及此前广受诟病的用户健康数据加密缺陷问题,相关行业争议正在逐步发酵。