细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型
MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。在模型结构上,引入了MaskedTransformer和ResidualTransformer,分别用于预测基础层的掩码动作标记和逐渐预测更高层次的标记。其在重建、生成和比较方面的实验证明了其在3D人体动作建模领域的卓越性能。
Hotshot-XL:无需高性能显卡也可体验文字生成动画
Hotshot-XL是一款顶尖的AI文本到GIF模型,专门针对StableDiffusionXL进行训练。它具备强大的功能,可以生成与任何已经或者新训练的SDXL模型相关的GIF动画。5.宽泛的应用:适用于各种场景,从创意媒体制作到广告等多领域。