任意文本、视觉、音频混合生成,多模态有了强大的基础引擎CoDi-2
研究者表示,CoDi-2标志着在开发全面的多模态基础模型领域取得了重大突破。今年5月,北卡罗来纳大学教堂山分校、微软提出一种可组合扩散模型,让一种模型统一多种模态成为可能。值得注意的是,在所有三个编辑任务中,它在所有指标—对数谱距离、Kullback-Leibler发散和FréchetDis-tance上都取得了最低得分。