MIT研究员推新AI图片生成框架DMD:AI 单步生成高质量图像 速度快30倍
在当今人工智能时代,计算机可以通过扩散模型生成自己的“艺术”,逐步向嘈杂的初始状态添加结构,直到清晰的图像或视频出现。扩散模型突然变得异常受欢迎:输入几个词,即可体验现实与幻想交汇的梦幻景象。当前版本使用StableDiffusionv1.5作为教师模型,学生继承了一些限制,如渲染文本和小脸部的细节描绘,这表明更先进的教师模型可能进一步提升DMD生成的图像。
AI视野:通义千问发布Qwen1.5;背景分割开源模型RMBG v1.4来了;OpenAI 为 DALL-E3添加新水印;苹果图片项目MGIE上线试玩
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
OpenAI 正在为 DALL-E3生成的图片上增加新水印
OpenAI的图像生成器DALL-E3将在图像元数据中添加水印,以支持越来越多公司对内容来源和真实性的标准的实施。该公司表示,C2PA的水印将出现在ChatGPT网站和DALL-E3模型API生成的图像中。“我们相信,采用这些建立来源的方法,并鼓励用户认识到这些信号,对增加数字信息的可信度至关重要,”OpenAI在其网站上表示。
新AI图像分割方法GenSAM:一个提示实现批量图片分割
研究人员提出了一种新型图像分割方法,称为GeneralizableSAM模型。该模型的设计目标是通过通用任务描述,实现对图像的有针对性分割,摆脱了对样本特定提示的依赖。研究人员希望这种通用任务描述引导的图像分割方法能够推动计算机视觉领域的发展,提高模型在复杂场景下的分割准确性。