谷歌发布 “Vlogger” 视频模型框架:单张图片生成 10 秒视频
谷歌最近发布了一项名为“Vlogger”的新视频框架,可以通过仅一张图片和录音即可生成一个本人演讲视频。这一框架基于扩散模型,包含音频到人体动作和文本到图像模型两部分。随着技术的不断进步和完善,相信Vlogger将在未来有更广泛的应用和发展。
阿里推声画同步框架EMO 1张图片加音频即可生成对口型视频
阿里巴巴智能计算研究所提出了一种新的生成式框架EMO,只需输入图片和音频即可生成具有表现力的视频视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配,但也可能成为造假的利器,因此一些名人可能需要警惕了。需要注意的是,该框架目前仅用于学术研究和效果演示有待进一步优化和扩展其应用范围。
FindSD.art:上传一张图片就能匹配到Civitai里同风格的SD模型
FindSD.art是一个能够根据单张图像,帮助用户发现CivitAI的稳定扩散模型,从找到最符合其艺术风格的工具。用户只需上传图像,FindSD.art就能根据你上传的图片风格找到Civitai里面类似风格的SD模型。产品核心功能:通过上传单张图像,快速发现与之匹配的CivitAI稳定扩散模型,为用户提供个性化的艺术风格选择。
阿里推开源版“妙鸭”FaceChain 1张图片百种定制
FaceChain-FACT是阿里推出的一项人工智能生成个性化肖像的技术,通过DeformableNeuralRadianceFields技术从普通视频中创造自由视点的肖像。使用FaceChainAI照片生成模型,不需要提供多张照片训练LoRA,仅需一张用户照片即可生成高度定制的肖像,生成速度更是快过商业应用100倍,达到秒级。这对于人工智能生成内容的发展具有积极的推动作用。
阿里推创新视频生成技术Animate Anyone 一张图片即可生成平滑稳定视频
阿里推出了一项名为AnimateAnyone的研究,该研究通过引入扩散模型,克服当前图像到视频合成中的一些挑战,特别是在角色动画领域。论文提出了一种全新的框架,通过巧妙设计的ReferenceNet、姿势引导器和时间建模方法,解决了维持细节一致性和运动连贯性的问题。带来的技术突破和实证结果表明,这一方法在角色动画领域具有巨大的潜力,为数字媒体和创意产业注入了新的活�
两张图看懂iQOO 12系列 自研双芯组合,性能更出众
iQOO正式发布了全新旗舰iQOO12系列,两款产品搭载了骁龙8Gen3处理器还配有自研电竞芯片Q1。iQOO12系列还对外观设计进行了更新,颜值手感都在线,话不多说,下面用两张图带你看懂iQOO12系列。目前京东平台已经上架了iQOO12系列,感兴趣的朋友可以点击文章下方链接了解详情。