2026年2月20日,谷歌正式宣布,其Gemini应用已全面集成DeepMind最新研发的音乐生成模型Lyria 3。用户只需输入一段简短文字描述,或上传一张照片,系统即可在数秒内生成一段时长30秒的完整音乐作品。
Lyria 3支持多种创作路径:用户可直接以自然语言表达创作意图,例如指定音乐风格、情感基调或节奏特征,模型将据此生成包含人声、歌词与完整伴奏的原创歌曲;亦可上传图像或视频,模型将解析画面中的视觉元素与情绪氛围,自动匹配并生成贴合情境的背景音乐,并同步生成由Nano Banana设计的专属封面图像。
YouTube内容创作者可通过Dream Track功能体验Lyria 3,为Shorts短视频快速配乐。该功能目前已在美国上线,并正分阶段向全球其他市场拓展。
消息发布后,欧美主要流媒体音乐平台股价出现波动,其中Spotify盘中回吐当日近5%的涨幅,Sirius XM亦短暂转为下跌。分析指出,尽管Lyria 3短期内尚不足以动摇主流音乐平台的核心地位,但有望推动行业加速布局AI辅助创作与混音能力。
对谷歌而言,将高质量音频生成能力深度嵌入面向大众的移动应用,不仅提升了终端产品的实用价值与差异化竞争力,也进一步印证了其人工智能技术在消费端的商业化路径与实际回报潜力。
为尊重既有音乐版权体系,当用户提示中提及真实音乐人姓名时,系统仅将其视为宽泛的艺术参考来源,所生成作品仅在风格、气质或结构层面体现启发性关联,不会模仿特定作品或复制受保护表达。同时,所有输出曲目均采用SynthID技术嵌入不可见水印,确保AI生成内容可被有效识别与溯源。
长期以来,生成式人工智能在音乐领域的应用始终伴随审慎甚至质疑的声音,业内普遍关注其对创作者权益、版权机制及产业生态可能带来的影响。此次谷歌通过明确的技术约束、内容过滤与水印标识等多重机制,在推动创新的同时,主动构建起与音乐人、版权方及平台方之间的责任边界,力图实现技术演进与行业共识的协同演进。
目前,Lyria 3已面向全球年满18周岁的用户开放,支持英语、德语、西班牙语、法语、印地语、日语、韩语、葡萄牙语等多语种输入与输出。后续将持续扩展语言覆盖范围,并持续优化音乐生成的丰富度、表现力与一致性。

评论
更多评论