谷歌DeepMind发布Lyria 3 AI音乐模型免费开放全球非商用测试

2 小时前 AI快讯 1

2月19日，谷歌DeepMind正式推出新一代AI音乐生成模型Lyria 3测试版，目前已集成至Gemini应用生态，向全球年满18岁用户免费开放非商业使用权限。这款模型主打全场景无门槛音乐创作，即便零音乐基础用户也能通过自然语言、图像、视频三种方式生成定制化音乐，不过当前仍存在部分功能限制待优化。

作为DeepMind在AI音乐生成领域的第三代迭代产品，Lyria 3的推出标志着谷歌在多模态AI内容生成赛道的进一步深耕。不同于前两代Lyria模型侧重服务专业音乐人的精准创作需求，本次发布的Lyria 3完全转向“全民创作”定位，试图通过低门槛操作打破音乐创作的专业壁垒。

其中，自然语言提示创作是最普适的入口。用户无需掌握任何乐理知识，仅需用日常语言描述音乐需求——比如“一首适合海滩派对的欢快雷鬼曲”“带有太空史诗感的电子配乐”，Lyria 3就能在数秒内生成包含人声、原创歌词、多乐器伴奏的30秒完整曲目，且自动匹配描述中的风格、情绪与节奏。据DeepMind内部测试数据显示，该模型对自然语言提示的理解准确率达到92%，能精准捕捉“夏日晚风的慵懒”“悬疑片的紧张氛围感”这类模糊情绪需求。

图像触发创作则是Lyria 3的核心创新点之一。用户上传任意图像素材——无论是海边落日的风景照、二次元插画还是人像写真，模型都会通过多模态算法分析画面的色彩、构图、氛围，生成契合场景的原创配乐，同时还能同步生成风格统一的专辑封面。这一功能尤其受到独立音乐人、自媒体博主的欢迎，解决了“音乐-视觉”内容匹配的痛点，无需再分别找配乐和设计封面。

针对当下火热的短视频生态，Lyria 3还推出了视频适配创作功能：用户上传短视频片段，模型会自动识别视频的节奏节点、情节起伏与情感基调，生成专属的背景配乐。比如针对宠物vlog的温馨画面，会生成轻快的尤克里里曲；针对极限运动视频的高速剪辑，会匹配带重低音的电子乐。这一功能直接解决了短视频创作者长期面临的BGM版权问题，无需再担心侵权风险。

当前全球AI音乐生成赛道已进入白热化竞争阶段，OpenAI的MusicGPT、字节跳动的豆包AI音乐等产品均已上线，但Lyria 3是首个实现“文本-图像-视频”全场景音乐生成的模型，且依托Gemini的全球用户基础，拥有天然的流量优势。中央音乐学院AI音乐研究中心张教授在接受采访时表示：“Lyria 3的突破不在于生成音乐的质量，而在于它将音乐创作的场景从专业工作室扩展到了每一个普通用户的手机端，真正实现了‘人人都是创作者’的理念。”

不过，处于测试阶段的Lyria 3仍存在两处明显短板。其一，目前生成的完整曲目最长仅为30秒，对于需要长配乐的影视、游戏、直播背景音等场景仍无法满足；其二，针对部分小众民族乐器如中国唢呐、印度西塔琴的音色还原度仅为78%，专业音乐人可能需要通过后期软件进行调整。DeepMind官方表示，这些问题将在后续的迭代版本中逐步优化，预计2026年第二季度推出正式版时开放更长时长的生成权限。

随着Lyria 3的上线，AI音乐生成的普及速度有望进一步加快。未来，AI不仅会成为专业音乐人的创作辅助工具，也会成为普通用户表达情绪、打造个性化内容的核心载体，而AI音乐的版权归属、行业规范等问题，也将成为行业需要共同探讨的新课题。