极客前沿

极客资讯 正文

谷歌Gemini变身AI音乐人:Lyria 3让聊天窗口秒变录音棚

2026-02-19 00:30 | The Verge AI ...

聊天机器人突然会写歌了

如果你还在用Gemini聊天机器人问天气、写邮件,那可能要刷新一下认知了——这个AI助手刚刚解锁了音乐制作技能。谷歌近日宣布,将DeepMind研发的Lyria 3音频模型整合进Gemini应用,用户现在可以直接在聊天窗口里生成30秒的原创音乐,支持文字描述、图片参考甚至视频片段作为创作灵感。

从“文字游戏”到“声音魔术”

这可不是简单的背景音乐生成器。Lyria 3的能力相当惊艳:你可以告诉它“来一首非洲节拍风格的曲子,献给我妈妈,回忆我们成长的美好时光”,系统就会生成包含歌词和旋律的完整曲目。更酷的是,上传一张海滩日落照片或一段城市夜景视频,AI就能创作出与之氛围匹配的音乐,连封面图都由Nano Banana自动生成,一键分享到社交平台毫无压力。

News Image

目前这项功能已在全球上线,支持英语、德语、西班牙语、法语、印地语、日语、韩语和葡萄牙语,仅限18岁以上用户使用。谷歌特别强调,这些AI音乐的目标不是创作“大师级作品”,而是提供一种有趣、独特的自我表达方式——说白了,就是让普通人也能过把音乐制作人的瘾。

版权雷区的“探戈舞步”

AI音乐最敏感的话题永远是版权。Lyria系列模型去年首次亮相时,曾展示过模仿知名歌手风格的能力,这在行业内引发了巨大争议。谷歌这次学聪明了,明确表示Lyria 3“专为原创表达设计,而非模仿现有艺术家”。当用户要求特定艺人的风格时,系统会生成“类似风格或情绪”的曲目,同时通过过滤器检查输出内容是否与现有作品过于相似。

News Image

这种谨慎态度不难理解。就在几个月前,TikTok和微软Copilot相继推出AI音乐功能,整个行业都在版权问题上如履薄冰。谷歌选择此时将Lyria从云端平台推向消费级应用,既是对市场时机的把握,也是对自身技术伦理的一次公开测试。

多模态AI的“交响乐”

Lyria 3的推出远不止是“又一个AI工具”。它标志着生成式AI正从单一的文字、图像领域,向声音、音乐等更复杂的创作维度扩展。想象一下:未来你拍摄一段旅行视频,AI不仅能自动剪辑,还能配上一首与场景完美契合的原创BGM——这正是谷歌正在布局的愿景。

News Image

事实上,Lyria 3也将接入YouTube的Dream Track工具,为Shorts短视频创作者提供定制化AI配乐。这意味着内容创作的门槛将进一步降低,普通人也能产出专业感十足的多媒体作品。当然,这也引发了新的问题:当AI能轻松生成高质量音乐,专业音乐人的价值该如何体现?

迟到者的“逆袭剧本”

有趣的是,谷歌在这个赛道上其实是个“迟到者”。Lyria模型早在2023年就已发布,但一直局限于Google Cloud的Vertex平台,普通用户难以接触。而竞争对手如TikTok的AI音乐功能、微软Copilot的作曲工具早已进入大众视野。

News Image

不过,迟到未必是劣势。谷歌凭借DeepMind在AI音频领域的技术积累,加上Gemini庞大的用户基础,完全有可能后来居上。毕竟,将AI音乐制作无缝集成到日常聊天场景中,这种“无感创新”正是谷歌最擅长的打法。

现在打开你的Gemini应用,试着输入一段文字描述,或许30秒后,你就能拥有第一首属于自己的AI生成单曲。只是别忘了,如果哪天它给你写了首爆款金曲,版权到底算谁的——这个问题的答案,可能比AI技术本身更值得玩味。