当地时间2026年4月6日,谷歌在iOS平台低调上线实验性语音输入应用Google AI Edge Eloquent。该产品搭载谷歌Gemma4系列自动语音识别模型,主打边缘侧离线运行、智能去杂润色功能,可实时将口语转化为专业文本。此举标志着谷歌正式入局由Wispr Flow、SuperWhisper领跑的高端AI语音转文字赛道。
图源: 图像由AI生成近年远程办公、播客创作、学术采访等场景的普及,让AI语音转文字从小众工具变为大众刚需。但绝大多数主流转写产品依赖云端计算,用户语音数据需要上传至服务商服务器处理,隐私泄露风险始终是悬在用户头上的达摩克利斯之剑。
此前主打离线运行、高准确率的高端转写赛道基本由Wispr Flow、SuperWhisper两家主导,普遍采用月付30-50元的订阅模式,用户门槛不低。谷歌此次以免费实验性产品切入,直接冲击现有市场定价体系。
Google AI Edge Eloquent的核心能力来自于谷歌最新推出的Gemma4系列(E2B/E4B规格)自动语音识别模型,依托边缘AI技术,所有转写计算完全在用户手机本地完成,无需联网上传任何数据。**用户仅需在首次使用时下载对应语言的模型包,即可实现毫秒级低延迟转写,即便在飞机、地下室等无网场景下也能正常使用**。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
18 分钟前
2026年4月,西班牙卫星初创公司Xoople宣布完成1.3亿美元B轮融资,本轮由Nazca Capital领投,西班牙科技发展基金CDTI等机构参投。公司专注为AI模型提供地面真值数据源,CEO Fabrizio Pirondini称其专用卫星星座采集的数据精度较现有系统提升两个数量级,目前已接入微软、Esri等企业级平台生态。

23 分钟前
根据全球AI模型分发平台OpenRouter2026年4月7日发布的监测数据,中国AI大模型周调用量已连续五周超越美国,2026年3月30日至4月5日当周达12.96万亿Token,环比增长31.48%,占全球总调用量近五成。阿里巴巴Qwen系列、小米MiMo-V2-Pro等产品表现突出,中国厂商包揽全球大模型周调用量榜单前六位。

54 分钟前
2026年4月,Ted Entertainment、Matt Fisher、Golfholics三家YouTube频道共同发起集体诉讼,指控苹果、亚马逊、OpenAI绕过平台反爬虫机制,非法下载数百万条视频数据用于AI模型训练,争议核心为包含数千万训练样本的Panda-70M数据集,本次诉讼也被视为AI音视频训练数据版权纠纷的标志性案件。

1 小时前
谷歌近期正式推出旗下全新免费AI听写应用,基于Gemini大模型语音模块训练优化,支持多语种混合识别、离线输入等功能。该产品被业内认定为付费听写工具Willow的核心替代选项,上线首周全球下载量突破120万次,92%的首批用户给出四星以上评分,有望改写消费级语音输入工具的现有市场格局。

1 小时前
2026年美国职场出现名为FOBO(Fear of Becoming Obsolete,即被淘汰恐惧)的新型职场心理。毕马威调研显示,40%员工将AI导致的失业作为主要焦虑源,63%受访者认为AI让工作环境更缺乏人性。Anthropic CEO达里奥·阿莫代伊、微软AI CEO穆斯塔法·苏莱曼等行业人士均提示AI对白领岗位的替代风险,当前岗位技能需求迭代速度较一年前提升66%。

1 小时前
近日谷歌正式发布全开源Gemma4系列大模型,该系列通过底层架构创新实现性能跨级跃升,其中最小激活参数量仅3.8亿的版本,性能超越参数规模20倍的同类大模型。Gemma4覆盖2.3B到31B多参数档位,可直接部署于手机、轻薄本等消费级终端,将大幅降低通用AI落地门槛。

1 小时前
2026年4月,国家安全部就AI核心基础单元词元(Token)发布专项安全警示,当前国内词元日均调用量已突破140万亿,截至2026年3月调用规模较2024年初增长超千倍。随着国家数据局正式对Token作出定名,其已成为智能时代的AI服务核心结算单位,此次警示重点点名身份劫持、金融骗局等新型风险,为快速扩张的AI应用市场敲响安全警钟。

1 小时前
2026年4月7日,谷歌正式在iOS平台推出全离线语音听写应用Google AI Edge Eloquent,该产品基于谷歌自研轻量化大模型Gemma构建,可实现100%本地处理语音数据,无需联网即可完成转录、自动剔除语气词、文本润色等功能,既解决了高敏感场景的隐私泄露风险,也填补了离线语音转录智能优化的市场空白。