2026年4月,谷歌低调推出面向iOS系统的离线优先AI听写应用,该产品搭载谷歌自研轻量级开源大模型Gemma,主打无网络环境下高准确率语音转写功能,直指当前听写赛道头部产品Wispr Flow,是谷歌在C端AI工具轻量化落地的最新动作,填补了其移动端离线语音交互产品的布局空白。
图源: 图像由AI生成经常在地铁、地下停车场等信号盲区需要记录会议内容、采访素材的用户,如今多了一个新的工具选择。近日不少iOS用户发现,苹果应用商店已经上架了谷歌推出的全新听写应用,该应用在介绍页最醒目的位置标注了「离线可用」标识,下载量在上线一周内已经突破10万次。
此前主流语音转写工具大多依赖云端算力,用户必须在网络稳定的环境下才能获得较好的转写效果,一旦断网要么完全无法使用,要么准确率下降超过30%。过去两年,面向创作者、职场人的垂直听写工具需求增速超过200%,其中Wispr Flow凭借稳定的离线转写功能,已经积累了超过2000万全球用户,是当前赛道的头部玩家。
这款新应用的核心能力来自谷歌2024年推出的轻量级开源大模型Gemma,不同于谷歌面向通用场景的PaLM大模型,Gemma的参数规模更小,专门针对端侧部署做了优化。**在语音转写场景下,该应用离线状态下的中文、英文转写准确率均超过97%,和联网状态下的主流听写工具表现基本持平**,而且所有计算都在本地完成,不会上传用户的语音数据到云端,隐私安全性远高于同类联网产品。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
3 天前
谷歌近期正在推进端侧轻量化大模型Gemini Nano 4的终端适配工作,预计2025年第一季度发布的下一代安卓旗舰机型将率先搭载该模型。其端侧推理性能较上一代提升62%,支持离线语音交互、实时图像生成等12项新增本地AI功能,无需上传数据至云端即可完成运算,在隐私安全性、响应速度上均有显著提升。

3 天前
2026年4月3日,谷歌DeepMind正式开源推出旗下迄今最强开放大模型Gemma 4系列,共覆盖4种参数规模,最小版本仅2B参数可直接在手机端运行,且全系列支持免费商用。该系列单位参数性能远超参数规模达其20倍的同类模型,31B参数版本位列Arena AI文本排行榜全球开放模型第三位,高难度科学推理基准GPQA Diamond准确率达85.7%。

3 天前
2026年4月3日,谷歌正式发布Gemini API全新定价策略,新增标准、弹性、优先、批量、缓存五大服务档位,其中弹性、批量档位推理成本较标准档直降50%,分别适配延迟容忍度1-15分钟、最长24小时的非实时场景,可满足不同开发者从实时调用到大规模离线处理的多元算力需求。

3 天前
2026年4月消息,谷歌联合能源公司Crusoe Energy在美国得克萨斯州阿姆斯特朗县投建装机容量933兆瓦的天然气发电厂,为其Goodnight AI数据中心园区供电,项目已于今年1月提交许可并启动建设。电厂投用后年碳排放预计达450万吨,该举动引发行业对谷歌2030年零碳运营承诺能否兑现的广泛质疑。

3 天前
北京时间2026年4月3日,谷歌正式推出全新开源大模型Gemma4,该系列基于Gemini3技术栈打造,共包含2.3B、4.5B高效版及26B MoE、31B稠密版四种规格,全系支持多模态输入,高效版原生支持端侧实时语音理解,31B稠密版本在Arena AI文本榜单中位列全球开源模型第三,大幅降低前沿AI能力的本地部署门槛。

3 天前
2026年4月3日,谷歌正式发布新一代开源AI模型Gemma4,放弃此前Gemma系列采用的限制性自定义许可,改用行业通用的Apache2.0开源协议,允许全球开发者自由使用、修改、分发模型并用于商用场景。该模型在性能与生态兼容性上实现双重升级,可大幅降低AI落地的技术与法律门槛。

4 天前
近日谷歌宣布调整AI Pro订阅服务权益,所有已付费的AI Pro订阅用户无需额外支付费用,即可将原有云存储空间升级至5TB。该订阅服务包含Gemini Advanced大模型使用权限、Google Workspace AI增强功能等权益,本次升级覆盖全球超百万活跃付费用户,预计将进一步提升谷歌AI订阅产品的市场竞争力。

4 天前
2026年4月,谷歌DeepMind首席执行官Demis Hassabis通过社交平台暗示,新一代开源大模型Gemma 4即将正式发布。该模型参数规模达120B,为上代Gemma 3的4倍,采用MoE混合专家架构,激活参数仅15B,有望在民用级显卡实现本地离线运行。谷歌意在借这款产品,从中国厂商主导的开源大模型市场夺回话语权。