登录体验完整功能(收藏、点赞、评论等) — 已累计有 12598 人加入

阿里通义实验室发布Fun-ASR1.5 支持30种语言多方言语音转写

详情页推荐

2026年4月20日,阿里旗下通义实验室正式发布新一代语音识别大模型Fun-ASR1.5。该模型采用统一大模型架构,解决了语音AI领域长期存在的通用性与精准度平衡难题,可支持全球30种主流语言、汉语七大方言及20余种地方口音的高精度转写,目前已上架阿里云百炼平台,将通过API服务为多行业智能化升级提供技术支撑。

在AI语音赛道,技术落地已经渗透到各行各业,但长期以来存在一个难以调和的核心痛点:针对单一场景优化的模型识别精度高,但换场景、换语种就容易出错;而追求全场景适配的通用模型,又往往会在复杂语境下牺牲识别精度。中国市场本身存在多方言、口音差异大的特点,不少特殊场景如传统文化音频的数字化转写,更是过往模型的能力盲区。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。