MuseV:虚拟人视频完整解决方案 保持角色一致、不限视频长度
MuseV是一个基于扩散的虚拟人类视频生成框架,支持无限长度生成,使用了一种新颖的视觉条件并行去噪方案。已经发布了在人类数据集上训练的虚拟人类视频生成模型。开发团队表示,未来将发布MuseTalk,一个实时高质量的嘴型同步模型,可以与MuseV一起作为完整的虚拟人类生成解决方案。
Lightricks发布LongAnimatediff 解决单次生成视频长度问题
Lightricks公司最近发布了LongAnimatediff项目,这一次主要解决的问题是Animatediff一次只能生成16帧视频的限制。LongAnimatediff则包括两个模型,一个可以最多一次生成64帧的视频,另一个可以生成32帧的视频32帧那个效果更好。目前推荐使用64帧的模型。
视频生成工具StreamingT2V:可根据文字描述生成2分钟长度的视频
StreamingT2V是一款独特的视频生成工具,它采用了自回归方法来逐帧生成视频内容。它会根据前一段视频的内容来生成下一段内容,就像连环画中,每一幅画都是基于前一幅来绘制的。6、模型灵活性:StreamingT2V的效果不依赖于特定的文本到视频的模型,意味着随着基础模型的改进,视频质量有望进一步提升。