Google的Gemini最近弄了个AI音乐生成功能,用的是Lyria 3模型,算是把音乐创作推到了一个新高度。就在上个月,谷歌在有7.5亿活跃用户的Gemini里上线了这个功能。只要你打几个字或者上传张图,几十秒就能拿到一首有歌词和封面的完整歌曲。这套东西是DeepMind搞出来的Lyria 3模型驱动的,它学了超过200万首歌,支持英语、日语、韩语这些语言,现在是Beta版给满18岁的人用。比起老版本,这次技术突破挺大的,你不用自己写词,直接输关键词就行,音乐风格什么的控制得也更精准。音质也很顶,用的是48kHz立体声,人声也挺自然。 另外还有个Nano Banana模型专门负责给曲子做封面,你要是发了照片或者视频,系统还能分析情绪配歌。为了防止版权问题,谷歌也做了不少工作,训练的时候很注意版权协议,生成的东西会加SynthID水印。如果你怕收到假的AI歌,还能去检测一下是不是谷歌产的。 官方说设计这个主要是为了鼓励原创,要是你提到某个歌手,那只是个风格参考,不会直接把人家的声音复制过来。现在这个功能已经装进YouTube Dream Track里了,给做短视频的人当背景音乐用了。 有分析说谷歌这一招是要把AI音乐的竞争从单纯的技术较量变成生态系统的比拼。虽然Suno那些创业公司在专业编辑这块做得不错,但跟Gemini比起来用户数量差了好几个量级。 测试的人说这功能挺适合平时玩的,比如把购物清单改成说唱,或者给旅游照片配个曲儿。不过这次做的时间只有30秒,而且是Beta版嘛,稳定性还得再练练。谷歌这时候把它放出来给那么多用户用,摆明了就是想抢住AI音乐的入口。 以后创作门槛更低了,从专业录音棚到手机软件,AI都在改变大家怎么玩音乐。以后每个人都能随便当个作曲家,音乐可能就是用来即时传递情绪的工具了。不过背后的版权和伦理问题肯定还得一直吵下去,但大家想玩工具的心思是挡不住的。