登录体验完整功能(收藏、点赞、评论等) —

让AI触手可及,让应用激发潜能

阿里通义实验室发布Fun-ASR1.5 支持30种语言多方言语音转写

2026年4月20日,阿里旗下通义实验室正式发布新一代语音识别大模型Fun-ASR1.5。该模型采用统一大模型架构,解决了语音AI领域长期存在的通用性与精准度平衡难题,可支持全球30种主流语言、汉语七大方言及20余种地方口音的高精度转写,目前已上架阿里云百炼平台,将通过API服务为多行业智能化升级提供技术支撑。

在AI语音赛道,技术落地已经渗透到各行各业,但长期以来存在一个难以调和的核心痛点:针对单一场景优化的模型识别精度高,但换场景、换语种就容易出错;而追求全场景适配的通用模型,又往往会在复杂语境下牺牲识别精度。中国市场本身存在多方言、口音差异大的特点,不少特殊场景如传统文化音频的数字化转写,更是过往模型的能力盲区。

此次发布的Fun-ASR1.5,核心突破就是通过统一大模型架构,实现了通用性与精准度的平衡。该模型在训练阶段就整合了多语种、多方言的海量语料,不需要开发者针对不同场景单独做差异化微调,既降低了适配成本,也保证了全场景的识别表现。

!
信息及评测声明: 本文部分信息整理自互联网公开资料,并包含由 AI创作导航 团队独立进行的实测体验。我们力求内容客观准确,但因工具功能、价格及政策可能存在实时调整,所有信息仅供参考,请务必在使用前访问官网确认。文中观点不构成任何决策建议,读者需自行评估和承担使用风险。如发现内容有误或侵权,欢迎随时反馈,我们将及时核实处理。
相关资讯
AI小创