趣AI | 谷歌发布新AI模型AudioLM,几秒音频提示即可生成同风格语音和钢琴曲
最近,谷歌研究人员开发了一项人工智能系统AudioLM,只需输入几秒钟的音频即可生成听起来相似风格的音频,包括钢琴音乐,生成的声音听起来与原始音频的音色几乎没有区别...该技术类似于语言模型,主要根据提示语音内容,自行预测并生成更多关联的内容...谷歌称,它可以加快音频生成的人工智能训练过程,并最终自动生成音乐为视频配音...通过对原始音频波形的大型语料库进行训练,AudioLM学会了在给出简短提示的情况下生成自然和连贯的语音内容...