简易版PS来了!Win11自带“照片”新增一键抠图功能
微软为WindowsInsider频道用户推送了照片”应用程序的2023.11110.8002.0更新版本,最主要的是新增了图片背景编辑功能。当打开照片”应用选择编辑图像”之后,该应用会弹出提示建议用户试试看不同的背景”,同时在右侧区域会出现三种背景处理方式,分别是模糊处理、去除以及替换。目前该更新仅向Insider频道推送了,预计会在未来几周内向所有用户推送。
上海智能实验室推图文多模态大模型InternLM-XComposer2(浦语·灵笔2)
InternLM-XComposer2是一款先进的视觉-语言模型,在自由组合文本和图像以及理解这两者之间的内容方面表现卓越。这款模型不仅超越了传统的视觉-语言理解能够巧妙地将多样化的输入,如概要、详尽的文本描述和参考图片,融合成包含文本和图像的复合内容,实现高度定制化的创作。这使得InternLM-XComposer2成为当前领先的视觉-语言模型之一,为多领域的创作和理解任务提供了卓越
DreaMoving图文转视频官网入口 Ai文生视频免费软件app
DreaMoving是一个基于扩散的可控视频生成框架,用于制作高质量的定制视频。具有身份控制、运动操纵和视频外观控制的功能。DreaMoving可以帮助用户生成具有高度定制化和可控性的舞蹈视频,满足用户的各种需求。
谷歌Gemini官网体验入口 Ai智能图文聊天免费app
Gemini是谷歌推出的最强对话式人工智能系统,具备多模态、多任务、多语言的特点。它不仅能处理多种数据类型,包括文本、图像等能理解和生成各类内容。Gemini还被描述为一个可以处理多种数据类型、具备理解和生成文本、图像等各类内容的能力,并且具有多模式特点。
中国团队开源大规模高质量图文数据集ShareGPT4V
中国团队最近开源了一个引人瞩目的图文数据集,命名为ShareGPT4V,它基于GPT4-Vision构建,训练了一个7B模型。这一举措在多模态领域取得了显著的进展,超越了同级别的模型。这一成果对于推动人工智能领域的发展具有积极的意义。
Glyph-ByT5:确保AI绘画图片中文字渲染的准确性并自动排版
在当今的数字时代,图像生成任务的重要性日益凸显。一个长期存在的问题是文本渲染的准确性。改善场景中的文字显示:Glyph-ByT5还可以改善现实场景图片中文字的显示,无论是路标、广告牌还是衣服上的文字,都能清晰、准确地呈现。