Interfaze推出首个开源多语言Diffusion ASR模型支持6种语言转写

AI创作导航管理员 LV4 资深连续登录7天萌新

1 小时前

风向

AI初创公司Interfaze于近期正式推出开源语音识别模型diffusion-gemma-asr-small，这是全球首个基于扩散技术的开源多语言自动语音识别（ASR）模型，依托DiffusionGemma架构的并行降噪解码器能力，可实现6种主流语言的高准确率语音转写，为下游语音类AI应用开发者提供了新的低成本、高灵活度的方案选择。

对于多语言语音应用开发者而言，长期以来都面临两难选择：调用谷歌、亚马逊等大厂的闭源ASR接口，成本随调用量飙升的同时数据安全存在隐患；使用现有开源ASR方案，又往往面临多语言支持不全、转写准确率不足、推理速度慢等问题。而Interfaze本次推出的新模型，恰好填补了这一市场空白。

据近期AI开发工具调研机构的统计数据显示，在涉及跨境业务的AI应用开发者中，有68%的受访者表示需要用到多语言语音转写能力，但其中仅32%的开发者选择使用开源ASR方案，剩下的开发者不得不支付高昂的闭源接口费用。

开源AI模型语音AI DiffusionGemma 自动语音识别 Interfaze

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

Interfaze推出首个开源多语言Diffusion ASR模型支持6种语言转写

最新文章

X社区 · 无限公约

二狗PPT

腾讯游戏启动2026暑期未保专项升级AI双引擎防沉迷模式

甲骨文豪掷千亿布局AI算力回款隐忧引发资本市场震动

瑞银2025财富报告：AI热潮拉动全球富豪规模快速扩张

Interfaze推出首个开源多语言Diffusion ASR模型支持6种语言转写

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

Interfaze推出首个开源多语言Diffusion ASR模型 支持6种语言转写

最新文章

X社区 · 无限公约

二狗PPT

腾讯游戏启动2026暑期未保专项 升级AI双引擎防沉迷模式

甲骨文豪掷千亿布局AI算力 回款隐忧引发资本市场震动

瑞银2025财富报告：AI热潮拉动全球富豪规模快速扩张

Interfaze推出首个开源多语言Diffusion ASR模型 支持6种语言转写

热门文章

OpenCut

抖音创作者中心

小云雀AI

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

Interfaze推出首个开源多语言Diffusion ASR模型支持6种语言转写

腾讯游戏启动2026暑期未保专项升级AI双引擎防沉迷模式

甲骨文豪掷千亿布局AI算力回款隐忧引发资本市场震动

Interfaze推出首个开源多语言Diffusion ASR模型支持6种语言转写