近日,阿里通义实验室语音团队推出两款全新语音生成模型——Fun-CosyVoice3.5与Fun-AudioGen-VD。其中Fun-CosyVoice3.5升级语音理解力,新增4种语言支持并将首包延迟降低35%;Fun-AudioGen-VD可实现音色定制、角色模拟等功能,两款模型均支持FreeStyle指令,大幅降低语音创作门槛,将为播客、游戏等领域提供AI助力。
对于播客创作者、游戏语音设计师而言,过去生成符合需求的语音内容往往依赖专业音频知识或复杂参数调试,如今阿里通义实验室的新模型正在打破这一壁垒,用自然语言交互重构语音创作的体验。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录