Mustango:结合扩散模型, 提高文本生成音乐质量
在文本到音乐合成领域,生成内容的质量一直在提高,但对音乐方面的可控性仍未得到探索。新加坡科技与设计大学和伦敦玛丽女王大学的研究人员提出了一个名为Mustango的解决方案,它扩展了Tango文本到音频模型,旨在通过丰富的说明来控制生成的音乐,这些说明包含与和弦、节拍、速度和键相关的具体指令。研究人员发布了MusicBench数据集,为未来的文本到音乐合成研究提供了资源。