Midjourney发布random功能 可基于提示词生成完全随机的图像风格
Midjourney发布了一个有趣的功能,可以基于提示词生成完全随机的图像风格。使用方式:在提示词后添加--srefrandom,如果找到了喜欢的风格可以通过--srefurl将风格迁移到新图片上。无论是个人创作还是与他人合作,Midjourney的新功能都将为用户提供更多创作灵感和交流的机会。
Stability AI推出全面的API服务,引领图像处理新时代
StabilityAI宣布推出一套全新的API服务,旨在提供更全面、更高效的图像处理服务。这一举措无疑将为图像处理领域带来一场革命。这可以确保输出结果与用户的意图保持一致,避免了因为AI理解错误导致的问题。
FiT:一种全新的Transformer架构图像生成模型 分辨率和高宽比不受限制
灵活视觉变换器是一种全新的Transformer架构图像生成模型,专门设计用于创造没有分辨率和宽高比限制的图像。相较于传统将图像视为固定分辨率网格的方法,FiT将图像视为一系列可变大小的图像块。FiT的问世将为图像生成领域带来新的可能性,为用户提供更加灵活多样的图像生成体验。
图像分割模型Mask2Former:同时支持语义、实例和全景分割
在深度学习技术的推动下,图像分割领域发生了巨大变革VisionTransformers在其中发挥了重要作用。本文介绍了一种基于Transformer的图像分割模型——Mask2Former,该模型在语义、实例和全景分割任务上都能够使用相同的架构,具有通用性。在实际应用中,需要根据具体需求权衡模型性能和资源消耗,选择合适的模型。
Google Bard 全球更新:支持40种语言、添加图像生成功能
GoogleBard今天宣布进行全球更新,将GeminiPro大语言模型功能扩展到40种语言,并为其添加图像生成功能。Bard还获得了来自领先基准的新质量认可。此次更新是Bard发展过程中的重要一步,它将使Bard更加易于使用和更具竞争力。
用2D图像补全3D场景,谷歌发布NeRFiller
在许多3D场景捕获中,由于网格重建失败或者缺乏观测,例如,物体接触区域或难以触及的区域,场景中的某些部分经常会出现缺失的情况。谷歌和加州大学伯克利分校的研究人员提出了NeRFiller框架,可通过2D图像来修复残缺的3D场景,同时发现当图像形成2x2网格时,会生成更多3D一致性的修复效果。为了优化3D场景的几何形态,NeRFiller在室内场景中可加入了相对深度的监督,补全后预测深度,只对补全区域施加排序损失。
研究人员开发过滤器处理不安全的AI生成图像
AI图像生成器因其便捷性变得异常受欢迎,但也引发了一系列问题。在CISPAHelmholtz信息安全中心的研究中,研究员YitingQu探讨了这些图像生成器中存在的不安全图像问题,并提出了一种用于解决此问题的过滤器。她希望通过这项研究帮助减少未来互联网上流传的有害图像数量。
研究人员推出全新训练方法 提高DALL-E 3图像生成能力
在人工智能领域,改进文本到图像生成模型的研究一直备受关注。DALL-E3作为这个领域的杰出代表,因其出色的文本描述生成图像的能力备受瞩目。这种策略不仅提高了DALL-E3的性能为复杂的文本到图像生成技术的持续发展奠定了基础。
AI视野:OpenAI成全球第三最有价值初创公司;SDXL推精简版本;小米14将搭载WPS AI功能;Bing AI拒绝生成女性逼真图像
微软的Bing AI图片生成器在生成逼真男性图像方面表现出色,但拒绝生成逼真女性图像,声称这不符合其内容政策,引发了性别相关问题的讨论。
Bing AI图片生成器拒绝生成女性的逼真图像,称其“不安全”
微软的BingAIImageCreator最近引起了关注,因为它似乎拒绝生成逼真的女性图像,声称这些图像不符合其内容政策。这一现象引发了许多讨论,特别是关于AI系统如何处理性别相关问题。需要在传播深度伪造色情内容和将女性消失之间找到平衡点。
地图显示大面积红色堵车 湖北:计划2月6日高速堵点全部抢通
1月31日以来,中东部大范围雨雪天气已持续7天,湖北、湖南、安徽等地,部分高速路段因雨雪冰冻天气导致拥堵和封闭。地图软件显示,湖北武汉、仙桃、潜江、荆州等地,部分高速路段仍属于红色拥堵状态,仍有不少春运返家车辆滞留在高速上。一方面是在抢通高速,另一方面大雪、冻雨天气又将持续;中央气象台预计,今明两天南方大范围雨雪天气持续,湖南大部、湖北东南部等地仍有冻雨;虽然强度比上一轮要小,但是因为叠加前期灾害,压力仍比较大。