2026年4月,谷歌低调推出面向iOS系统的离线优先AI听写应用,该产品搭载谷歌自研轻量级开源大模型Gemma,主打无网络环境下高准确率语音转写功能,直指当前听写赛道头部产品Wispr Flow,是谷歌在C端AI工具轻量化落地的最新动作,填补了其移动端离线语音交互产品的布局空白。
图源: 图像由AI生成经常在地铁、地下停车场等信号盲区需要记录会议内容、采访素材的用户,如今多了一个新的工具选择。近日不少iOS用户发现,苹果应用商店已经上架了谷歌推出的全新听写应用,该应用在介绍页最醒目的位置标注了「离线可用」标识,下载量在上线一周内已经突破10万次。
此前主流语音转写工具大多依赖云端算力,用户必须在网络稳定的环境下才能获得较好的转写效果,一旦断网要么完全无法使用,要么准确率下降超过30%。过去两年,面向创作者、职场人的垂直听写工具需求增速超过200%,其中Wispr Flow凭借稳定的离线转写功能,已经积累了超过2000万全球用户,是当前赛道的头部玩家。
这款新应用的核心能力来自谷歌2024年推出的轻量级开源大模型Gemma,不同于谷歌面向通用场景的PaLM大模型,Gemma的参数规模更小,专门针对端侧部署做了优化。**在语音转写场景下,该应用离线状态下的中文、英文转写准确率均超过97%,和联网状态下的主流听写工具表现基本持平**,而且所有计算都在本地完成,不会上传用户的语音数据到云端,隐私安全性远高于同类联网产品。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
2 天前
2026年5月,谷歌正式面向全球Pixel智能手机用户推送AI个性化图标功能,依托自研生成式AI图像模型,用户可一键将全桌面应用图标替换为迪斯科球样式,目前该功能已覆盖超过92%的常用第三方应用,上线3天内已有超120万Pixel用户激活使用,引发行业对AI终端个性化赛道的新一轮关注。

2 天前
2026年谷歌I/O开发者大会推出的Gemini系列按算力计费新规上线后遭遇全球付费用户强烈抵制,大量开发者与内容创作者在Reddit、X等平台集中投诉,不少用户仅高强度使用1-2小时就触发5小时额度冷却限制。谷歌DeepMind团队、AI编程工作区Antigravity总监Varun Mohan近期公开回应,宣布将Gemini Pro、Ultra付费用户的使用额度永久提升3倍,快速平息舆论争议。

3 天前
近日谷歌全量上线原生AI概览功能,原本传统搜索的网页排序结果被大模型生成的整合内容前置,据用户行为调研机构统计,2026年第一季度谷歌用户对AI生成错误内容、冗余信息的投诉量同比上涨127%,至少6款主打差异化路线的新兴搜索引擎用户量环比增速突破300%,全球搜索赛道迎来近十年最大的变量节点。

3 天前
近期谷歌正式面向消费级市场推出完整的AI代理生态规划,计划2026年年内上线超20款覆盖生活全场景的原生AI代理应用,同时向第三方开发者开放全栈适配接口。不过最新行业调研数据显示,目前仅32%的普通消费者愿意授权AI代理处理个人事务,这套酝酿已久的新生态落地前景仍存在不小的不确定性。

3 天前
全球半导体厂商AMD正式发布面向端侧AI场景的全新Ryzen AI Max 400系列处理器,最高可支持192GB统一内存容量,彻底打破过往移动端AI算力平台的内存瓶颈。该产品可直接本地运行70B甚至更大参数的开源大模型,首批适配的移动工作站产品预计2025年第二季度逐步放量,有望重构端侧AI硬件的现有竞争格局。

3 天前
2026年5月21日谷歌正式宣布推出AI原生编程开发工具AI Studio的Android版本,目前该产品已在Google Play应用商店开启全区域预注册通道。这款面向零基础新手和资深开发者的智能开发工具,依托大模型驱动的智能提示能力大幅简化应用搭建流程,打破传统PC端开发的场景限制,有望进一步扩大移动端开发人群基数。

4 天前
2026年5月21日,Adobe正式推送Photoshop 27.7版本更新,首次将端侧AI模型植入经典移除工具(Remove Tool),实现图像移除操作完全本地运行无需上传云端。同步升级的还有Creative Cloud订阅用户权益,生成式创作积分额度直接翻倍,开放云端/本地算力自由切换功能,大幅降低专业创作者的AI工具使用门槛与隐私泄露风险。

4 天前
全球科技巨头谷歌正式推出原生AI驱动的信息代理产品,该工具可在后台自动监控用户自定义的各类主题,主动向用户推送相关内容的最新变动,无需用户反复手动发起搜索。这款产品由谷歌搜索团队耗时2年打磨落地,首批开放三大类核心场景测试,年内将逐步向过亿活跃用户开放推送。