2026年3月25日,Google DeepMind正式推出AI音乐生成模型Lyria 3 Pro,距上一代产品发布仅间隔6周。该模型将单轮生成时长从此前的30秒大幅提升至3分钟,新增结构感知能力可自主生成包含前奏、主歌、副歌的完整歌曲,标志着AI音乐工具从片段生成向专业创作工具的迭代,同类厂商Suno、Udio早在2025年初已落地相关功能。
如果你此前用过AI音乐工具,大概率有过类似的体验:输入提示词生成的30秒片段氛围感足够,但要么没有完整的段落递进,要么重复单调,想凑出一首能完整发布的歌曲,往往需要手动拼接十几个不同的生成结果,还要花大量时间调整衔接处的违和感。而DeepMind这次的升级,直接解决了这个困扰行业许久的痛点。
本次发布的Lyria 3 Pro,核心升级点集中在两个维度:一是单轮生成时长从30秒跃升至3分钟,刚好覆盖了绝大多数流行歌曲的标准时长;二是新增的结构感知能力,让模型第一次真正理解了流行音乐的创作逻辑。
用户现在可以直接在提示词中指定需要的段落结构,比如“20秒前奏+两段主歌+副歌+15秒桥段+收尾”,模型会自动匹配对应的旋律起伏、编曲层次和情绪变化,不会出现此前同类产品常见的副歌转主歌时的调性违和、节奏脱节问题。
值得注意的是,这次升级距离上一代Lyria 3的发布仅过去了六周时间,远快于此前大模型平均3-6个月的迭代周期,也侧面体现了DeepMind在多模态生成领域的技术储备厚度。
事实上,完整歌曲生成能力并非Lyria 3 Pro首创。美国初创公司Suno和Udio早在2025年初就已经落地了相关功能,前者单轮生成时长最高可达5分钟,支持用户分段落调整编曲风格和歌词内容,后者则和环球音乐、索尼音乐达成了版权合作,生成内容可直接用于商用场景。
登录后解锁全文,体验收藏、点赞、评论等完整功能
立即登录
13 小时前
北京时间2026年5月19日,谷歌正式宣布由Gemini大模型驱动的Google AI Studio独立移动应用登陆Google Play商店,面向全球用户开放预注册,将原有桌面端AI开发平台的能力完整迁移至移动设备,零编程门槛的普通用户仅需自然语言描述创意,即可快速生成可直接运行的小程序原型,大幅降低轻量化AI应用的创作门槛。

18 小时前
Google将于2026年I/O开发者大会上披露核心技术布局,旗下Gemini AI模型的多模态能力迭代、搭载原生AI交互的Android 17系统将成发布重点。面对GPT-5、Apple Intelligence等竞品的生态竞争,此次推出的跨设备AI整合方案,有望重构移动与桌面端的智能服务体验,吸引全球开发者与用户的高度关注。

1 天前
据本媒体获悉,谷歌旗下主打多模态交互的大语言模型Gemini近期正在全球小范围测试针对所有用户的每周使用限制规则。参与内部测试的用户反馈显示,免费用户的每日对话轮次、API调用频次已被明确设置固定阈值,这一调整引发了部分创作者、学生群体的不满,也被视作谷歌加速AI服务商业化布局的关键信号。

1 天前
近日,Google旗下AI大模型Gemini正式推出全新思维层级(Thinking Level)功能,允许用户根据任务复杂度灵活调整AI的“运算强度”——从日常闲聊到代码调试、多模态推理,用户可自主选择对应层级的算力配置。该功能是Gemini在个性化交互上的关键升级,目前已覆盖全终端,进一步强化了其应对专业场景的能力,为用户提供更高效的AI使用方案。

1 天前
近期,AI大语言模型赛道的动作频繁,核心玩家纷纷推进下一代技术迭代。OpenAI已透露GPT-5研发进展,预计2024年末发布;Google旗下Gemini高级版月活突破1200万,微软将Copilot深度嵌入Windows 11,加速AI落地,行业正迎来新一轮技术与应用的双向升级。

1 天前
近期Google推出的Gemini Intelligence AI服务对运行硬件设置了严格规格要求,包括指定芯片算力、内存容量及神经网络处理单元等关键指标。据科技行业观察,当前全球超60%的主流安卓及iPhone机型因核心参数未达标,将无法适配该AI模型的完整功能,这一限制直接抬高了普通用户接入原生端AI服务的使用门槛。

1 天前
近日,Google推出针对语音输入优化的AI工具Rambler,瞄准传统语音输入误识别率高、互动生硬、需大量手动修正的普遍痛点,试图通过AI技术重构语音交互的流畅性。在GPT系列、微软Copilot、Google Gemini等AI产品扎堆的交互赛道中,Rambler精准聚焦输入场景的体验升级,或为长期被诟病的语音输入带来质的改变。

1 天前
近期OpenAI、Google、苹果等科技巨头在AI模型领域动作频繁:OpenAI传出GPT-5研发进入关键阶段,多模态能力预估值较GPT-4提升超30%;Google Gemini迭代至1.5 Pro版本,支持100万token上下文窗口;苹果Apple Intelligence或于2024年底试...