阿里文生视频挑战Gen-2、Pika,1280×720分辨率无压力,3500万文本-视频对显奇效
图源备注:图片由AI生成,图片授权服务商Midjourney文生视频领域又卷起来了!文生视频可以精细到什么程度?最近,阿里巴巴的一项研究给出了答案:1280×720分辨率没有压力生成效果非常连贯。这些demo来自阿里联合浙江大学、华中科技大学提出的文生视频模型I2VGen-XL,该模型能够生成各种类别的高质量视频,如艺术画、人像、动物、科幻图等。在图6中是本文单独生成的样本,可以观察到视频和文本表现出很高的语义一致性。