火山引擎发布豆包音频生成模型1.0 单指令生成影视级完整音频

AI创作导航管理员 LV4 资深连续登录7天萌新

4 小时前

风向

2026年6月23日，字节跳动旗下云服务品牌火山引擎正式发布豆包音频生成模型1.0（Doubao-Seed-Audio 1.0）。该模型支持文本、音频多模态输入，可通过单条Prompt同步生成对白、音效、背景音乐全要素音频内容，角色声音连续10分钟不串戏，彻底替代传统音频制作多轨剪辑流程，大幅降低专业内容产出门槛。

有声内容创作者林默最近刚赶完一档品牌定制播客的样片，放在过去，单是15分钟内容的配音、音效对位、多轨混音就要耗掉她2天时间，这次她只用了不到1小时就完成了全部内容生产——支撑这一效率跃升的，正是火山引擎刚推出的这款音频大模型。

过去多年，音频内容生产始终是重人力、重专业的领域：一段符合上线标准的有声剧、播客、影视配音或品牌音频，需要经过台词录制、音效素材匹配、多轨对齐、混音调整等多个环节，重度依赖专业后期人员的技术能力，单人单天产出的成品内容通常不超过30分钟。

火山引擎 AIGC 音频生成大模型豆包音频生成模型1.0

免责声明：本网站AI资讯内容仅供学习参考，不构成任何建议，不对信息准确性与完整性负责。

火山引擎发布豆包音频生成模型1.0 单指令生成影视级完整音频

最新文章

X社区 · 无限公约

二狗PPT

OpenAI测试Bidi1语音模型 ChatGPT开启双向实时对话新时代

Anthropic旗下Mythos数小时检出美机密系统漏洞已被临时管控

腾讯企业微信内测AI智能体“大圆” 提效办公与客户经营

千问发布全球首个原生语言世界模型推动AI智能体落地突破

热门文章

OpenCut

小云雀AI

抖音创作者中心

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

让AI触手可及，让应用激发潜能

火山引擎发布豆包音频生成模型1.0 单指令生成影视级完整音频

最新文章

X社区 · 无限公约

二狗PPT

OpenAI测试Bidi1语音模型 ChatGPT开启双向实时对话新时代

Anthropic旗下Mythos数小时检出美机密系统漏洞 已被临时管控

腾讯企业微信内测AI智能体“大圆” 提效办公与客户经营

千问发布全球首个原生语言世界模型 推动AI智能体落地突破

热门文章

OpenCut

小云雀AI

抖音创作者中心

视频号助手

通义万相

朱雀AI检测助手

标签

探索分类

帮助与支持

联系我们

安装网站应用

Anthropic旗下Mythos数小时检出美机密系统漏洞已被临时管控

千问发布全球首个原生语言世界模型推动AI智能体落地突破