2026年4月20日,阿里旗下通义实验室正式发布新一代语音识别大模型Fun-ASR1.5。该模型采用统一大模型架构,解决了语音AI领域长期存在的通用性与精准度平衡难题,可支持全球30种主流语言、汉语七大方言及20余种地方口音的高精度转写,目前已上架阿里云百炼平台,将通过API服务为多行业智能化升级提供技术支撑。
在AI语音赛道,技术落地已经渗透到各行各业,但长期以来存在一个难以调和的核心痛点:针对单一场景优化的模型识别精度高,但换场景、换语种就容易出错;而追求全场景适配的通用模型,又往往会在复杂语境下牺牲识别精度。中国市场本身存在多方言、口音差异大的特点,不少特殊场景如传统文化音频的数字化转写,更是过往模型的能力盲区。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录