知名生成式AI企业Stability AI正式推出全新一代音频生成模型Stability Audio 3.0,本次迭代除了推出最长可生成6分钟完整原创歌曲的大版本之外,配套的轻量化小模型已支持端侧部署,可在本地设备生成最长2分钟的音频片段,大幅降低音乐创作的算力门槛,进一步拓宽了消费级AIGC音频产品的落地边界。
不少独立音乐人和内容创作者都有过类似的体验:此前用AI工具生成完整歌曲,往往要先拆分出副歌、主歌、桥段等多个片段分别生成,再花大量时间拼接调整,稍有不慎就会出现风格脱节的问题,整个流程耗时动辄数小时。而Stability AI的最新发布,恰好瞄准了这个困扰行业许久的核心痛点。
过去两年全球AIGC音频赛道快速升温,但绝大多数主流公开产品,都只能稳定输出30秒到1分钟左右的高质量音频片段,一旦生成时长超过2分钟,就很容易出现旋律断裂、歌词语义混乱、前后曲风不统一的问题。想要得到一首结构完整的流行歌曲Demo,用户往往要经过十几轮反复生成、手动剪辑拼接,学习成本和时间成本都居高不下。
这次推出的Stability Audio 3.0采用了全新的时序注意力训练架构,整套模型分为两个不同定位的版本。
大参数云端版本优先面向专业创作者场景优化,用户只需要输入曲风描述、参考歌手音色、完整歌词文本,模型就可以一次性生成最长6分钟的连贯完整歌曲,全程不会出现明显的节奏断层、旋律跳脱问题,甚至能够自动生成符合流行歌逻辑的前奏、间奏、尾奏结构。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 秒前
2026年5月20日,谷歌在I/O 2026开发者大会正式推出全新轻量大模型Gemini 3.5 Flash,其运行速度较前代提升4倍,综合表现超越上一代旗舰模型Gemini 3.1 Pro,在智能体运行、代码开发等核心场景达到顶级水准。谷歌宣布该模型即日起面向全球所有用户免费开放,大幅拉低顶尖大模型的使用成本,或将推动整个AI应用开发生态迎来新一轮变革。

4 分钟前
北京时间2026年5月20日,谷歌在年度I/O开发者大会正式发布面向智能穿戴设备的Wear OS 7系统。本次升级重点聚焦用户长期吐槽的续航痛点与轻量化智能交互需求,官方数据显示从Wear OS 6升级后续航最高可提升10%,同时首次将Gemini Intelligence大模型能力植入腕端,首批适配机型为2026年新发布的智能手表产品。

6 分钟前
北京时间2026年5月19日,谷歌正式推出Gemini家族最新旗舰多模态模型Gemini Omni,该模型首次实现文本、音频、图像、视频四类信息的并行统一理解处理,跨模态交互流畅度较前代Gemini 2 Pro提升超60%,有望打破当前多模态AI的场景适配瓶颈,为消费级产品和行业解决方案提供全新技术底座。

7 分钟前
2026年5月举办的谷歌I/O开发者大会上,谷歌正式推出全新全时在线AI代理平台Gemini Spark,该产品由新一代Gemini 3.5 Flash大模型驱动,依托谷歌云虚拟机架构实现关闭终端后仍24小时不间断后台运行,打通原生与第三方应用生态,有望彻底改写现有智能助手的功能定义。

10 分钟前
2026年5月20日谷歌在年度I/O开发者大会上正式面向全球Workspace用户发布全新AI图像设计工具Google Pics,这款网页端产品深度融合文生图与交互式编辑能力,支持用户通过文字或语音指令一键产出邀请函、海报等视觉内容,单轮生成最多可提供4套差异化方案,采用类Canva的轻量化交互逻辑,标志着谷歌正式切入商用轻量化AI设计赛道。

13 分钟前
腾讯旗下微信AI团队在2026年西班牙巴塞罗那举办的ICASSP国际声学与信号处理大会上,凭借面向视障出行的WalkVLM-LR新型视觉语言模型成果拿下最佳工业论文奖。这一设立于2016年的奖项此前十年均由海外科技巨头包揽,本次是中国企业首次获奖,相关技术大幅降低信息冗余延迟,为AI无障碍落地提供了全新可行路径。

18 分钟前
2026年5月举办的谷歌I/O开发者大会上,谷歌联合三星携手潮流眼镜品牌Gentle Monster、经典眼镜品牌Warby Parker,推出两款深度集成Gemini大模型的AI智能眼镜,产品定位为手机能力延伸设备,覆盖通勤、漫步、购物等多日常场景,可实现免手持交互、实时导航等核心功能,大幅降低用户对手机的依赖,首批量产备货规模超过80万台,将于今年第三季度正式开售。

20 分钟前
2026年5月20日,通义实验室正式推出新一代AI Agent基座大模型Qwen3.7-Max,依托独创的“任务-运行框架-验证器”正交解耦技术,在多项权威行业评测中斩获国内第一。该模型攻克了智能体长链路易中断的痛点,在无任何先验数据的ZW-M890L PPU极限测试中实现连续35小时运行、1158次工具调用零中断。