谷歌DeepMind发布Lyria 3 AI音乐模型 免费开放全球非商用测试
2月19日,谷歌DeepMind正式推出新一代AI音乐生成模型Lyria 3测试版,目前已集成至Gemini应用生态,向全球年满18岁用户免费开放非商业使用权限。这款模型主打全场景无门槛音乐创作,即便零音乐基础用户也能通过自然语言、图像、视频三种方式生成定制化音乐,不过当前仍存在部分功能限制待优化。
作为DeepMind在AI音乐生成领域的第三代迭代产品,Lyria 3的推出标志着谷歌在多模态AI内容生成赛道的进一步深耕。不同于前两代Lyria模型侧重服务专业音乐人的精准创作需求,本次发布的Lyria 3完全转向“全民创作”定位,试图通过低门槛操作打破音乐创作的专业壁垒。
其中,自然语言提示创作是最普适的入口。用户无需掌握任何乐理知识,仅需用日常语言描述音乐需求——比如“一首适合海滩派对的欢快雷鬼曲”“带有太空史诗感的电子配乐”,Lyria 3就能在数秒内生成包含人声、原创歌词、多乐器伴奏的30秒完整曲目,且自动匹配描述中的风格、情绪与节奏。据DeepMind内部测试数据显示,该模型对自然语言提示的理解准确率达到92%,能精准捕捉“夏日晚风的慵懒”“悬疑片的紧张氛围感”这类模糊情绪需求。
图像触发创作则是Lyria 3的核心创新点之一。用户上传任意图像素材——无论是海边落日的风景照、二次元插画还是人像写真,模型都会通过多模态算法分析画面的色彩、构图、氛围,生成契合场景的原创配乐,同时还能同步生成风格统一的专辑封面。这一功能尤其受到独立音乐人、自媒体博主的欢迎,解决了“音乐-视觉”内容匹配的痛点,无需再分别找配乐和设计封面。
针对当下火热的短视频生态,Lyria 3还推出了视频适配创作功能:用户上传短视频片段,模型会自动识别视频的节奏节点、情节起伏与情感基调,生成专属的背景配乐。比如针对宠物vlog的温馨画面,会生成轻快的尤克里里曲;针对极限运动视频的高速剪辑,会匹配带重低音的电子乐。这一功能直接解决了短视频创作者长期面临的BGM版权问题,无需再担心侵权风险。
当前全球AI音乐生成赛道已进入白热化竞争阶段,OpenAI的MusicGPT、字节跳动的豆包AI音乐等产品均已上线,但Lyria 3是首个实现“文本-图像-视频”全场景音乐生成的模型,且依托Gemini的全球用户基础,拥有天然的流量优势。中央音乐学院AI音乐研究中心张教授在接受采访时表示:“Lyria 3的突破不在于生成音乐的质量,而在于它将音乐创作的场景从专业工作室扩展到了每一个普通用户的手机端,真正实现了‘人人都是创作者’的理念。”
不过,处于测试阶段的Lyria 3仍存在两处明显短板。其一,目前生成的完整曲目最长仅为30秒,对于需要长配乐的影视、游戏、直播背景音等场景仍无法满足;其二,针对部分小众民族乐器如中国唢呐、印度西塔琴的音色还原度仅为78%,专业音乐人可能需要通过后期软件进行调整。DeepMind官方表示,这些问题将在后续的迭代版本中逐步优化,预计2026年第二季度推出正式版时开放更长时长的生成权限。
随着Lyria 3的上线,AI音乐生成的普及速度有望进一步加快。未来,AI不仅会成为专业音乐人的创作辅助工具,也会成为普通用户表达情绪、打造个性化内容的核心载体,而AI音乐的版权归属、行业规范等问题,也将成为行业需要共同探讨的新课题。

1 天前
近日,AI测评机构Artificial Analysis发布语音转文字基准测试2.0(AA-WER v2.0)结果,在核心词错率(WER)指标中,ElevenLabs的Scribe v2以2.3%的错误率夺冠,谷歌Gemini 3Pro以2.9%位列第二;二者在AA-AgentTalk场景测试中同样表现领先,Mistral、OpenAI等厂商模型分列后续梯队,精准度与通用性成行业竞争核心。

1 天前
AI分析机构Artificial Analysis近日发布语音转文字基准测试2.0版,ElevenLabs与谷歌旗下模型表现突出。其中ElevenLabs的Scribe v2以2.3%的词错率斩获榜首,谷歌Gemini3Pro则以2.9%的词错率位居第二,值得关注的是,Gemini3Pro未针对转录任务专门训练,其优异表现源于自身的多模态通用能力。

3 天前
谷歌近期在官方开发者论坛发布重要通知,将于2026年3月9日正式停用Gemini 3 Pro Preview版本,并敦促所有相关开发者尽快迁移至Gemini 3.1 Pro Preview版本,避免服务中断。其中,使用“-latest”别名的用户将在3月6日自动完成版本切换,此举被视为谷歌巩固AI领域技术竞争力、加速新一代多模态模型落地的重要举措。

3 天前
AI音乐生成平台Suno首席执行官Mikey Shulman近日透露,平台付费用户已突破200万,年经常性收入达3亿美元。这家去年底完成2.5亿美元融资、估值24.5亿美元的AI公司,曾因音乐版权问题引发争议,近期已与华纳音乐达成和解,凭借自然语言生成音乐的功能打开商业化局面。

3 天前
谷歌近期在官方开发者论坛发布通知,将在2026年3月9日正式停用Gemini 3 Pro Preview版本,要求所有使用该版本的开发者尽快迁移至Gemini 3.1 Pro Preview,避免服务中断。其中,使用“latest”别名的用户将于3月6日被自动切换至新版本,这一举措凸显谷歌在大语言模型领域加速技术迭代的战略方向。

3 天前
谷歌近日在官方开发者论坛发布公告,将于2026年3月9日正式停用Gemini 3 Pro Preview模型服务,敦促相关开发者尽快迁移至Gemini 3.1 Pro Preview。过渡期设置两个关键节点:3月6日将“-latest”模型别名指向新版,3月9日旧版彻底停运;尽管新版在编程等核心能力上升级,开发者社区反应却呈现喜忧参半的态势。

3 天前
谷歌近日宣布,将于2026年3月9日正式停用Gemini 3 Pro Preview版本,要求开发者迁移至Gemini 3.1 Pro Preview;3月6日起使用-latest别名的用户将自动切换至新版。这一调整引发开发者社区关注,尽管新版在编程、数学能力上更优,但部分开发者担忧其在内容创作、幽默感等方面的表现不如旧版。

3 天前
AI音乐创作平台Suno联合创始人兼CEO Mikey Shulman披露最新运营数据,平台付费订阅用户已突破200万,年经常性收入(ARR)达3亿美元,较三个月前增长50%,凸显AI音乐生成领域正迎来爆发式增长,用户需求与商业化潜力持续释放。