MoA:用于图片合成的混合注意力架构 可实现风格参考和人物融合
在最新的研究中,提出了一种名为注意力混合模式的新架构,旨在个性化文本到图像扩散模型,可以实现风格参考和人物融合的效果。受大型语言模型中使用的专家混合机制的启发,MoA通过将生成工作负载分配给两个注意力路径来实现给定主题和背景的分离生成。这些应用展示了MoA在个性化图像生成领域的潜在价值和广泛适用性。
Domo AI推视频色度抠图功能 可将扣出的人物合成到新背景中
DomoAI近日推出了一项新功能,用户现在可以通过“--key”命令扣出主体人物后更换对应颜色的背景。这一功能的引入,无疑为用户带来了更多的便利和创作空间。DomoAI的这一新功能,无疑为用户提供了更多的创作自由度,使得视频和移动创作变得更加便捷和个性化。
个性化扩散模型微调方法DiffuseKronA:个性化扩散模型微调方法,大幅减少参数、合成高质量图像
针对文本到图像生成模型领域中的个性化主题驱动模型,出现了一些令人印象深刻的进展,如DreamBooth和BLIP-Diffusion。这些模型普遍存在着对微调的需求较高和参数规模庞大的限制。综合对比实验结果,DiffuseKronA在视觉质量、文本对齐性、可解释性、参数效率和模型稳定性等方面均优于LoRA-DreamBooth,为T2I生成模型的领域带来了重大进展。
InternLM-XComposer2官网体验入口 视觉语言AI模型文本图像合成在线使用地址
InternLM-XComposer2是一款领先的视觉语言模型,专注于自由形式文本图像合成与理解。该模型不仅能理解传统的视觉语言能从各种输入构建交织的文本图像内容,实现高度可定制的内容创作。InternLM-XComposer2的产品特色自由形式文本图像合成文本图像理解多模态内容创作为了获取更多详细信息并开始您的文本图像合成之旅,请访问InternLM-XComposer2官方网站。
Lumiere官网体验入口 AI视频合成、图像到视频、修补和风格化生成工具在线使用地址
Lumiere是一款先进的视频合成工具,致力于解决视频合成中的关键挑战。采用空时U-Net架构,Lumiere能够一次性生成整个视频的时间持续,展现真实、多样和连贯的运动。了解更多详情并开始体验Lumiere,请访问Lumiere官方网站。
InstantID官网体验入口 AI图像合成工具软件免费使用地址
InstantID是一种基于强大的扩散模型的解决方案,专门用于进行图像个性化处理,同时确保身份的保留和高保真度。InstantID引入了创新的IdentityNet技术,能够将单张面部图像与文本提示相结合,在多种风格下生成个性化图像。要了解更多信息并开始使用InstantID,请访问InstantID官方网站。
谷歌研究团队推新AI方法SynCLR:从合成图像和字幕中学习视觉表征
GoogleResearch和MITCSAIL共同推出了一项名为SynCLR的新型人工智能方法,该方法旨在通过使用合成图像和字幕,实现对视觉表征的学习,摆脱对真实数据的依赖。SynCLR的工作原理研究团队首先提出了一个三阶段的方法。这些改进有望进一步提升合成数据在训练人工智能模型中的效果。
新AI框架DreamSync:结合图像理解模型的反馈 改善文本到图像合成
来自南加州大学、华盛顿大学、巴伊兰大学和谷歌研究团队的研究人员推出了DreamSync,这是一种新型人工智能框架,致力于解决扩散型文本到图像模型中对齐和审美吸引力的问题无需进行人工标注、修改模型架构或使用强化学习。DreamSync的方法是通过生成候选图像,利用视觉问答模型对其进行评估,然后对文本到图像模型进行微调。拓展DreamSync的应用到其他模型架构,并在不同场景中进行性能评估和额外研究也是未来持续调查的方向。
谷歌人工智能鉴定美国登月照片系合成造假 俄罗斯表示有趣
据国外媒体报道称,谷歌人工智能鉴定美国登月照片系合成造假,这引起了网友围观。在莫斯科举行的人工智能世界之旅”国际会展上,美国谷歌公司的人工智能对一张美国登月的任务照片进行数据分析,用红色标注出该人工智能认为可能造假的部分。
浙大研究者提出UrbanGIRAFFE,解决城市场景的可控3D感知图像合成
浙江大学的研究人员最近提出了一种名为UrbanGIRAFFE的创新方法,用于解决具有挑战性的城市场景的可控3D感知图像合成问题。该方法通过引入可控的相机姿势和场景内容,以实现逼真的图像合成,特别是在处理具有挑战性的城市环境时。UrbanGIRAFFE通过在合成和实际数据集上进行全面评估,展示了在可控性和保真度方面超越各种2D和3D基线的出色性能。
效果超越SDXL!港中大博士生推出超真实人像合成工具,训练用了3.4亿张图
为了让AI画出的人更加逼真,港中大博士生用了3.4亿张图像专门训练画人。人物的表情、姿态,环境的空间关系、光线都能合理布局,可谓立体感十足。此外还有香港大学和南洋理工大学的学者对HyperHuman亦有贡献。