登录体验完整功能(收藏、点赞、评论等) — 已累计有 9341 人加入

让AI触手可及,让应用激发潜能

Stability AI推出全新音频生成模型 最长可生成6分钟原创歌曲

知名生成式AI企业Stability AI正式推出全新一代音频生成模型Stability Audio 3.0,本次迭代除了推出最长可生成6分钟完整原创歌曲的大版本之外,配套的轻量化小模型已支持端侧部署,可在本地设备生成最长2分钟的音频片段,大幅降低音乐创作的算力门槛,进一步拓宽了消费级AIGC音频产品的落地边界。

不少独立音乐人和内容创作者都有过类似的体验:此前用AI工具生成完整歌曲,往往要先拆分出副歌、主歌、桥段等多个片段分别生成,再花大量时间拼接调整,稍有不慎就会出现风格脱节的问题,整个流程耗时动辄数小时。而Stability AI的最新发布,恰好瞄准了这个困扰行业许久的核心痛点。

过去两年全球AIGC音频赛道快速升温,但绝大多数主流公开产品,都只能稳定输出30秒到1分钟左右的高质量音频片段,一旦生成时长超过2分钟,就很容易出现旋律断裂、歌词语义混乱、前后曲风不统一的问题。想要得到一首结构完整的流行歌曲Demo,用户往往要经过十几轮反复生成、手动剪辑拼接,学习成本和时间成本都居高不下。

这次推出的Stability Audio 3.0采用了全新的时序注意力训练架构,整套模型分为两个不同定位的版本。

大参数云端版本优先面向专业创作者场景优化,用户只需要输入曲风描述、参考歌手音色、完整歌词文本,模型就可以一次性生成最长6分钟的连贯完整歌曲,全程不会出现明显的节奏断层、旋律跳脱问题,甚至能够自动生成符合流行歌逻辑的前奏、间奏、尾奏结构。

免责声明:本网站AI资讯内容仅供学习参考,不构成任何建议,不对信息准确性与完整性负责。
相关资讯