登录体验完整功能(收藏、点赞、评论等) — 已累计有 12429 人加入

通义实验室发布Fun系列语音双模型,支持自然语言指令自由生成

详情页推荐

3月2日,阿里通义实验室正式发布Fun-CosyVoice3.5与Fun-AudioGen-VD两款语音大模型,首次支持FreeStyle自然语言指令交互,实现“一句话生成语音”的自由体验。其中Fun-CosyVoice3.5新增4个语种支持,通过强化学习技术将生僻字读错率从15.2%降至5.3%,首包延迟降低35%。

想象一下,无需设置复杂的音色标签、语调参数,只需说出“用慵懒的印尼语念一首热带小诗,背景混着海浪声”,就能直接生成符合要求的语音内容——这正是通义实验室最新发布的FreeStyle语音大模型带来的全新体验。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。