MuseV:虚拟人视频完整解决方案 保持角色一致、不限视频长度
MuseV是一个基于扩散的虚拟人类视频生成框架,支持无限长度生成,使用了一种新颖的视觉条件并行去噪方案。已经发布了在人类数据集上训练的虚拟人类视频生成模型。开发团队表示,未来将发布MuseTalk,一个实时高质量的嘴型同步模型,可以与MuseV一起作为完整的虚拟人类生成解决方案。
Lightricks发布LongAnimatediff 解决单次生成视频长度问题
Lightricks公司最近发布了LongAnimatediff项目,这一次主要解决的问题是Animatediff一次只能生成16帧视频的限制。LongAnimatediff则包括两个模型,一个可以最多一次生成64帧的视频,另一个可以生成32帧的视频32帧那个效果更好。目前推荐使用64帧的模型。
视频生成工具StreamingT2V:可根据文字描述生成2分钟长度的视频
StreamingT2V是一款独特的视频生成工具,它采用了自回归方法来逐帧生成视频内容。它会根据前一段视频的内容来生成下一段内容,就像连环画中,每一幅画都是基于前一幅来绘制的。6、模型灵活性:StreamingT2V的效果不依赖于特定的文本到视频的模型,意味着随着基础模型的改进,视频质量有望进一步提升。
谷歌副总裁 Sissie Hsiao:Gemini AI 演示视频「完全真实」,尽管谷歌「为了简洁而缩短了部分内容」
站长之家12月12日消息:在日益激烈的生成型AI市场竞争中,谷歌近期推出了其大型语言模型Gemini的预告视频。有关该视频真实性的争议随后引发了广泛关注。Hsiao表示,这些Gemini模型将继续改进谷歌搜索以及谷歌Bard聊天机器人,后者据她所说是「目前市场上最受欢迎的免费聊天机器人。