专为Stable Diffusion 1.5设计!IP Composition Adapter模型可模仿图片构图
一款名为IPCompositionAdapter的新型适配器引起了广泛关注。该适配器专为StableDiffusion1.5模型设计,其独特之处在于能够在新生成的图像中同步构图忽略风格和内容。随着SDXL变种的研发进展,我们有理由相信,这款适配器将为用户带来更加丰富的创意体验。
ControlNet作者新作:AI绘画能分图层了,项目未开源就斩获660 Star
“绝不是简单的抠图。”ControlNet作者最新推出的一项研究受到了一波高度关注——给一句prompt,用StableDiffusion可以直接生成单个或多个透明图层!例如来一句:可以看到,AI不仅生成了符合prompt的完整图像,就连背景和人物也能分开。毕竟张吕敏也被网友调侃为“时间管理大师”,对LayerDiffusion感兴趣的小伙伴可以提前mark一波了。
ComfyUI-InstantID官网体验入口 无需部署服务器的人物图像生成工具在线使用地址
ComfyUI-InstantID是一个在ComfyUI环境下对InstantID的非官方实现,可以让用户无需部署服务端就可以体验InstantID带来的人物图像生成效果。它支持从huggingfacehub自动下载模型,也可以加载本地模型。点击前往ComfyUI-InstantID官网体验入口获取更多信息并开始创造属于您的人物图像吧!
InstantID in ComfyUI来了!9种风格可选
InstantIDinComfyUI来了!让角色保持变得更加简单高效。只需一张图就可以实现高质量的角色保持还能随心选择多种风格。这些工作流的增加,为用户提供了更多的选择,使用体验更加丰富多彩。
ConvNet与Transformer谁更强?Meta评测4个领先视觉模型,LeCun转赞
【新智元导读】当前的视觉模型哪个更好?Meta团队最新一波研究来了。如何根据特定需求选择视觉模型?ConvNet/ViT、supervised/CLIP模型,在ImageNet之外的指标上如何相互比较?来自MABZUAI和Meta的研究人员发表的最新研究,在「非标准」指标上全面比较了常见的视觉模型。-CLIP模型具有较高的形状偏差,与其ImageNet精度相比,分类错误较少。
AI视野:Stability AI发布代码模型Stable Code3B;书生·浦语2.0正式开源;阿里推新项目MotionShop;Win11新增AI生成图像功能
StabilityAI公司发布了其首个新型人工智能模型,商业许可的StableCode3B。字节复旦团队提出metaprompts扩散模型图像理解力刷新SOTA过去一年,扩散模型逐渐在文生图领域扩展,能否处理视觉感知任务呢?字节跳动和复旦大学技术团队提出了简单有效方案,旨在提高模型在视觉识别任务中的性能。