苹果研究人员推出Keyframer:一款基于LLM的动画原型工具,可以从静态图像(SVG)生成动画
苹果的研究人员最近推出了一款名为Keyframer的动画原型工具,该工具采用了大型语言模型的动力,旨在从静态图像生成引人注目的动画。这标志着LLMs在创意领域的又一次创新应用。该研究为未来的动画设计工具提供了可能的方向,将生成能力与动态编辑器相结合,以实现更强大的创意控制和迭代。
百度推出视频生成模型UniVG 可处理各种文本和图像的组合输入
百度推出的UniVG是一款视频生成模型,其特点在于针对高自由度和低自由度两种任务分别采用不同的生成方式,以更好地平衡两者之间的关系。项目地址:https://univg-baidu.github.io/视频生成技术基于“扩散”原理的方法近来在学术和产业界引起广泛关注,并取得显著成就。这一成绩不仅超越了当前的开源方法与业界领先的闭源方法Gen2不相上下,显示出了卓越的实用价值和技术优势�
阿里团队推新AI模型I2VGen-XL:单张静止图像就能生成高质量视频
视频合成最近取得了显著的进步,这得益于扩散模型的快速发展。它在语义准确性、清晰度和时空连续性方面仍然存在挑战。研究人员还对人脸、3D卡通、动漫、中国画、小动物等多种图像进行了定性分析,展示了该模型的泛化能力。
阿里图像生成视频模型I2VGen-XL代码发布
阿里在11月份发布了论文,宣布将开源I2VGen-XL图像生成视频模型。他们终于发布了具体的代码和模型。通过这些数据,I2VGen-XL模型可以提高生成视频的语义准确性、细节的连续性和清晰度。