登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

阿里发布Fun-ASR1.5 语音转写准确率超字节腾讯同类产品

2026年4月20日,阿里巴巴正式推出新一代端到端语音识别大模型Fun-ASR1.5,该模型基于阿里千问大模型体系迭代研发,公开测试数据显示其语音转写准确率超过字节跳动、腾讯等业内头部厂商的同类产品。Fun-ASR1.5可识别30种语言,覆盖中文七大方言与20余种地方口音,优化了标点预测等核心能力,可广泛应用于会议纪要整理等多个生产力场景。

对于经常需要整理会议录音、采访素材的办公人群与内容从业者来说,语音转写后的人工校对往往要花费数倍于录音本身的时间,方言口音、标点错乱、专有名词错漏都是行业长期存在的痛点,阿里新一代语音识别大模型直指这些用户痛点。

近年来,远程办公普及、内容行业发展、司法数字化推进,带动全行业对自动化语音转写的需求持续攀升,市场规模逐年增长。但此前绝大多数产品在方言识别、复杂场景准确率上始终存在明显瓶颈,不少带口音的语音转写错误率超过15%,严重影响使用效率,行业呼唤精度更高、适配场景更广的技术方案。

作为阿里千问端到端语音识别大模型的新一代版本,Fun-ASR1.5 在多个核心维度实现了升级。除了支持30种主流语言的识别能力,它完整覆盖中文七大方言体系,可适配20余种地方口音,甚至专门强化了古诗词诵读的专项识别能力。

!
信息及评测声明: 本文部分信息整理自互联网公开资料,并包含由 AI创作导航 团队独立进行的实测体验。我们力求内容客观准确,但因工具功能、价格及政策可能存在实时调整,所有信息仅供参考,请务必在使用前访问官网确认。文中观点不构成任何决策建议,读者需自行评估和承担使用风险。如发现内容有误或侵权,欢迎随时反馈,我们将及时核实处理。
相关资讯
AI小创