Stability AI发布Stable Audio 3 长音频秒级生成破行业瓶颈

14 小时前

风向

2026年5月27日，人工智能企业Stability AI正式发布新一代音频大模型Stable Audio 3，同步开源部分非商用模型权重。该模型基于潜扩散技术架构，搭载SAME语义声学自编码器实现4096倍音频压缩率，支持高品质立体声输出、可变长度音频生成，长音频生成速度达到秒级，可覆盖音乐创作、音效制作等多元场景需求。

对于长期使用AI音频工具的创作者而言，生成等待时间长、输出音质达不到商用标准、内容长度无法灵活调整，是长久以来困扰行业的三大痛点。而Stable Audio 3的上线，恰好瞄准了这几项核心诉求，给整个音频创作赛道带来了新的解决方案。

过去几年，文本、图像领域的AIGC工具已经实现了规模化落地，但音频生成赛道的进展始终相对缓慢。一方面，普通用户需要的短视频配乐、播客音效等内容，现有工具要么生成效果粗糙，要么需要支付高昂的会员费用才能获得足够时长的高品质内容；另一方面，专业创作者需要的定制化音频内容，现有模型的编辑灵活度不足，往往需要多次调整prompt才能得到接近需求的成品，时间成本居高不下。

这种供需错配的核心原因，在于音频数据的压缩和生成效率难以平衡：要保证音质就需要处理海量数据，生成速度必然变慢；要提升速度就要牺牲采样率，音质又达不到要求。

Stable Audio 3的核心突破，就是从底层架构上解决了上述矛盾。整个模型由两大核心组件构成：SAME语义声学自编码器和高效扩散变换器。其中SAME自编码器实现了4096倍的超高音频压缩率，这一设计大幅缩短了模型需要处理的潜在序列长度，从根源上降低了算力消耗。

AI AIGC 3 Audio 音频大模型 Stability Stable 潜扩散技术

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

Stability AI发布Stable Audio 3 长音频秒级生成破行业瓶颈

最新文章

X社区 · 无限公约

AI小创 v2.0 升级公告：场景化模式与隐私切换，问答更随心

OpenAI调整ChatGPT广告策略取消20万预付门槛拥抱中小商家

谷歌将Fitbit更名Google Health 强推AI健康教练遭老用户抵制

OpenAI调整ChatGPT广告战略取消高门槛拥抱中小商家市场

Google SynthID累计调用超5000万次已接入搜索与Chrome浏览器

热门文章

3秒抓心！抖音爆款文案的5个钩子秘籍

小红书爆款笔记6个黄金法则：从标题到排版的实操指南

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

您好，我是AI助手

猜您想问

Stability AI发布Stable Audio 3 长音频秒级生成破行业瓶颈

最新文章

X社区 · 无限公约

AI小创 v2.0 升级公告：场景化模式与隐私切换，问答更随心

OpenAI调整ChatGPT广告策略 取消20万预付门槛拥抱中小商家

谷歌将Fitbit更名Google Health 强推AI健康教练遭老用户抵制

OpenAI调整ChatGPT广告战略 取消高门槛拥抱中小商家市场

Google SynthID累计调用超5000万次 已接入搜索与Chrome浏览器

热门文章

3秒抓心！抖音爆款文案的5个钩子秘籍

小红书爆款笔记6个黄金法则：从标题到排版的实操指南

抖音没流量？7个数据诊断法，3天精准定位问题

抖音爆款内容：3个底层逻辑，新手也能做出高赞视频

快手爆款秘籍：5 个通用技巧，小白也能轻松上手

抖音爆款打造指南：抓住这4个关键点，流量提升3倍

标签

探索分类

帮助与支持

联系我们

安装网站应用

OpenAI调整ChatGPT广告策略取消20万预付门槛拥抱中小商家

OpenAI调整ChatGPT广告战略取消高门槛拥抱中小商家市场

Google SynthID累计调用超5000万次已接入搜索与Chrome浏览器