Hugging、英特尔发布文生图一致性解决方案——SPRIGHT
Hugging和英特尔发布了提高文生图模型空间一致性的方案,大幅提高了模型对提示词中空间关系的理解能力。在当前的将文字描述转换为图像的技术中,一个关键短板是它们往往无法精准地生成与文字提示中所描述的空间关系相符的图像。他们还会开源这个模型和数据集,以便其他研究者和开发者能够利用这些资源来进一步提高文生图模型的性能。
图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东
能不能有一种通用的图模型——它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?或者既能预测不同作者的论文引用可以发现基因网络中的人类衰老机制?你还真别说,被ICLR2024接收为Spotlight的“OneforAll”框架就实现了这个“精髓”。它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。更多研究细节,可参考原�
WordArt Designer:基于ChatGPT的智能艺术字生成框架
WordArtDesigner是一款基于gpt-3.5turbo的艺术字生成框架,旨在通过四个关键模块:LLM引擎、SemTypo、Styltypo和TextTypo,将用户的抽象概念转化为具体的设计。LLM引擎由gpt-3.5turbo驱动,解释用户输入,推动整个框架的智能生成过程。这一框架有望推动艺术字设计领域的发展,为非专业设计师提供更加便捷、创造性的设计工具。
苹果官网正式下架iPad 9:实体Home键、Lightning接口时代终结
苹果在发布了全新的iPadAir、iPadPro之后更新了iPad10的价格,全面降价至2999元起。苹果还下架了老一代的iPad9机型,这也是苹果最后一款采用实体Home键、Lightning接口的iPad。iPad9外壳采用100%再生铝金属,主板焊料使用了100%再生锡,机身磁体使用了100%再生稀土元素。
Align Your Steps:低步数推理保持高质量结果 适用于SD 1.5和SDXL
在深度学习领域,扩散模型作为生成建模的前沿方法已经得到广泛应用。DMs的一个关键缺点是其较慢的采样速度,这主要是由于需要通过大型神经网络进行多次顺序函数评估。在视频生成方面进行了研究,发现使用优化计划可以在视频生成过程中产生更加稳定的视频,减少随时间推移的颜色失真。
AI文生图模型PixArt-sigma,可以生成4K分辨率图片
PixArt-sigma由华为诺亚方舟实验室联合多个研究机构共同开发的项目,是一个强大的文本到图像生成模型,通过弥散Transformer进行弱到强训练,旨在实现4K分辨率的图像生成。PixArt-sigma采用了弥散Transformer进行弱到强训练,从能够更好地生成高质量的4K分辨率图像。在应用方面,PixArt-Σ是一款强大的文本到图像生成工具,具有广泛的应用场景,可以满足艺术、设计、游戏开发、营销
AI图像编辑软件DesignEdit 像PS一样分图层处理图片
DesignEdit是一款突破性的图像编辑软件,它采用了设计领域中常见的图层概念,为用户带来了一种全新的空间感知图像编辑体验。通过将复杂的图像编辑任务分解为多层潜在的编辑操作,DesignEdit实现了对象移除、多对象编辑、镜头平移和缩放、排版编辑以及跨图像合成等一系列高级编辑功能。这不仅为创意设计提供了无限的可能性,也为图像合成和视觉特效制作带来了新的解决方案。
MiniGPT4-Video官网体验入口 视频理解多模态AI大模型使用地址
MiniGPT4-Video是什么?MiniGPT4-Video是为视频理解设计的多模态大模型,能处理时态视觉数据和文本数据,配标题、宣传语,适用于视频问答。用户可以上传视频,让模型生成标题与宣传语,理解特效处理,或作超美抒情诗。
AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝
【新智元导读】秒懂视频的AI诞生了!KAUST和哈佛大学研究团队提出MiniGPT4-Video框架,不仅能理解复杂视频,甚至还能作诗配文。OpenAI官方账号发布了第一支由Sora制作的MV——Worldweight,引全网围观。下一步研究将模型能力扩展到处理更长视频的能力。
谷歌 Pixel 8a 手机通过蓝牙 SIG 认证 属于中端机型
谷歌Pixel8a中端手机获得了蓝牙SIG认证,同时有四个不同型号:G8HNN、GKV4X、G6GPR和G576D。这意味着该款手机已经进入到了实锤阶段,并且有望在即将召开的GoogleI/O2024开发者大会上正式推出。随着谷歌I/O大会的临近,相信我们很快就能知道这款手机的具体细节情况了。
基于ChatGPT的人型机器人Figure01据称能帮忙做家务
由OpenAI的ChatGPT驱动的最新自动人型机器人在外观上与科幻电影中的机器人形象有相似之处,但并非杀人机器。这款名为Figure01的新机器人能够执行基本的自主任务,并能够与人进行实时对话,这都是在ChatGPT的帮助下实现的。”这款机器人使用了一个连接到大型语言模型的板载摄像头,以识别周围的环境。
ChatGPT有身体了!Figure01机器人接入OpenAI大模型
人形机器人领域的初创翘楚FigureAI发布了一段引人注目的视频,展示了其研发的Figure01机器人如何借助OpenAI的大模型能力,实现与人类的对话以及执行复杂任务。这款机器人不仅拥有高级视觉和语言智能展现出快速、灵巧的机器人动作,为人工智能与机器人技术的融合开创了新篇章。该公司还与宝马公司签署了商业协议,将在汽车制造中部署通用机器人,进一步拓展了人形机器人的应用领域。
小米相册AIGC编辑正式上线:智能扩图、魔法消除Pro来了
日前,小米手机宣布,小米相册AIGC编辑功能正式上线小米14Ultra。小米14、小米14Pro以及RedmiK70系列,也会在3月全量上线。有了智能扩图、魔法消除Pro,用户编辑照片将变得更简单、更高效、更有趣。
科幻片成真!Figure与OpenAI合作新进展 Figure 01接入ChatGPT后成“精”了!
Figure最新展示了他们与OpenAI合作的成果,这一合作让他们的机器人获得了惊人的能力。机器人可以进行语音对话、描述周围环境、做出决策推理、执行高层次请求,并口头解释推理过程。这些努力使得机器人的动作速度显著加快,接近人类速度,展示了合作的巨大潜力和成果。
8年画作卖出超100万美元:会画画的猪Pigcasso因病去世
世界著名的猪画师”猪加索于本月6日去世,此时离它八岁生日只差了一个月左右。猪加索是一只才华横溢的猪,它的画作售价超过100万美元,被誉为世界历史上最成功的非人类艺术家”。将近八年过去,这只体重450磅的猪患上了慢性类风湿性关节炎,在它去世之前,由于下脊柱钙化,导致两条后腿跛行,最终救治无效死亡。
华为发布图像生成模型PixArt-\Sigma 可直出4K图像
华为近日发布了一项名为PixArt-\Sigma的图像生成模型,该模型采用了DiT架构,可以直接生成4K分辨率的图像。相比于其前身PixArt-\alpha,PixArt-\Sigma在图像保真度上有了明显的提升,并改善了与文本提示的一致性。PixArt-\Sigma能够生成4K图像,为创建高分辨率海报和壁纸提供了支持,有效地增强了电影和游戏等行业中高质量视觉内容的制作。
因赛集团InsightGPT推出图生成视频服务
因赛集团旗下InsightGPT近期推出了图生成视频服务,为营销内容创作提供了新的智能化解决方案。该服务涵盖了两大子产品,即「AI卖点视频」和「AI动效海报」,旨在满足品牌营销的核心需求,提升视频内容创作的效率和品质。InsightGPT网页端入口:https://gpt.idealead.com/。
OpenAI宣布与Figure合作 将GPT整合到机器人
OpenAI宣布与独角兽Figure合作,旨在打造下一代AI大模型,提升机器人的语言处理和推理能力。Figure01通过学习实现煮咖啡等任务,借助OpenAI的多模态模型,其能力有望得到进一步提升。Adcock的创业历程和个人背景密切相关,他的决心和实力将继续推动Figure向着全球影响力最大的公司的目标迈进。
人形机器人厂商Figure AI获得48亿元融资,与OpenAI合作开发AGI机器人
FigureAI宣布成功获得48亿元人民币B轮融资,投资方包括微软、OpenAI创业基金、英伟达、贝索斯、英特尔等。这一巨额融资将极大推动Figure产品的商业部署,为其实体机器人“01”的发展提供强大支持。期待Figure与OpenAI共同推动人工智能技术在实际应用中的深度融合,为社会带来更多创新和便利。
SDXL-Lightning官网体验入口 字节跳动高分辨率AI图像生成软件工具app免费在线使用地址
SDXL-Lightning是字节跳动开发的图像生成模型,能够在一步或少步骤内生成高达1024像素分辨率的高质量图像。该模型通过渐进式对抗式蒸馏,显著提升了图像生成速度,使其可应用于需要快速响应的场景。要获取更多详细信息并使用SDXL-Lightning,请访问SDXL-Lightning网站。