FindSD.art:上传一张图片就能匹配到Civitai里同风格的SD模型
FindSD.art是一个能够根据单张图像,帮助用户发现CivitAI的稳定扩散模型,从找到最符合其艺术风格的工具。用户只需上传图像,FindSD.art就能根据你上传的图片风格找到Civitai里面类似风格的SD模型。产品核心功能:通过上传单张图像,快速发现与之匹配的CivitAI稳定扩散模型,为用户提供个性化的艺术风格选择。
一张图干翻了AI课赛道:李一舟、鹤老师被禁止关注,AI课下架
万万想不到,一天前还被“誉为”是AI圈里唯一一个可以和奥特曼平起平坐的华人大神李一舟,今天就灰头土脸地销声匿迹。三言陆续发现李一舟的“199元AI课程”已经下架,不仅如此,他用于卖课的小程序现已下线;李一舟个人视频号还被禁止关注。这其实未必是坏事,大浪淘沙,对推动行业发展也有积极作用。
一张图500元是目前AIGC最高“回报”?小冰李笛:调用API的商业模式不适用于未来 | MEET 2024
AIGC在商业界中,最大的一笔回报是多少?答案可能是:一张图片,500元。且这就是发生在最近、号称人工智能著作权第一案的真实案例:这个案子出来之后,引发了很多人都会讨论,认为它会不会对法学界、对人工智能的著作权、版权等问题的实践具有一些新的指导意义。因为这个时代似乎属于我们,就像当年的遗传学的时代属于孟德尔一样,谢谢大家。
视频生成框架WonderJourney:一句话一张图就能生成无限3D画面
斯坦福的华人研究人员最近推出了一项引人注目的创新视频生成框架WonderJourney,该框架可以通过一句话或一张图生成令人惊叹连贯的3D场景。这项技术由一位华人退学博士开发的Pika技术引领,成功地将人工智能技术与艺术相融合,开辟了一片新的视觉创作领域。这一创新有望在艺术、影视制作等领域带来新的可能性,为创作者提供更广阔的创作空间。
阿里推创新视频生成技术Animate Anyone 一张图片即可生成平滑稳定视频
阿里推出了一项名为AnimateAnyone的研究,该研究通过引入扩散模型,克服当前图像到视频合成中的一些挑战,特别是在角色动画领域。论文提出了一种全新的框架,通过巧妙设计的ReferenceNet、姿势引导器和时间建模方法,解决了维持细节一致性和运动连贯性的问题。带来的技术突破和实证结果表明,这一方法在角色动画领域具有巨大的潜力,为数字媒体和创意产业注入了新的活�
谷歌Genie爆打Sora,基础世界模型AGI来了?一张草图即生一个世界,通才智能体迎来新革命
【新智元导读】真正的「基础世界模型」诞生了!谷歌团队发布110亿参数Genie「精灵」,从一张图片就能创造出可玩的虚拟世界,动作可控碾压Sora。AI已经杀到视频游戏领域了。她还在澳大利亚国立大学获得了工程学学士学位。
PhotoMaker平替?一张照片InstantID几秒钟就能生成个性化图片
InstantID是一项新技术,可以通过仅有一张人脸照片,几秒钟内生成不同风格的人物照片。与传统方法需要多张参考图像和复杂的微调过程不同,InstantID只需一张图像无需复杂的训练或微调过程。这项技术支持多种风格化和写实的图像生成,能够适应不同的视觉需求,因此具有广泛的实用性和应用价值。
AI模型DiffPortrait3D:一张肖像图就能创造各种逼真表情3D表情
大型语言模型在人工智能社区引起了轰动,归功于其出色的能力和性能。这些模型在几乎所有基于AI子领域的行业中展现出了非凡的应用,包括自然语言处理、自然语言生成和计算机视觉。4.该方法结合了交叉视图注意力模块和3D感知噪声生成技术,提供了3D视图的长程一致性。
研究称:生成一张AI图像所消耗能源相当于给手机充满电
根据AI初创公司HuggingFace和卡内基梅隆大学的研究人员进行的一项新研究,每次使用AI生成图像、撰写电子邮件或向聊天机器人提问,都会对地球造成一定的负担。
《绝地求生》出了一张超大中国风地图:亭台楼阁太美了
虽然PC版吃鸡游戏《绝地求生》如今不再如之前火爆,玩家依然众多,最近11月份的在线峰值到达50万。官方一直在推陈出新,推出了不少新地图、新玩法。游戏中还有一片茂密的竹林,近战可为玩家提供掩护开车可以把竹子压倒,提供了有趣的玩法。
小米SU7充电枪无法解锁拔不出来怎么办 三张图教你搞定
如果小米SU7充电枪解锁功能出现故障,怎么解决呢?小米汽车官方进行了解答:如果用户充电枪出现解锁故障,可以使用应急解锁拉线进行解锁。如果仍然不能拔枪,再使用应急解锁不迟。
B站UP主用AI翻拍《火影忍者》真人版电影 10天画5000张图获赞86万
B站UP主“海军爱摄影”通过运用AI技术,成功制作了《火影忍者》真人版预告片的第一集,这一创新行为不仅激发了广大火影迷的怀旧情感,也再次证明了AI在影视制作领域的强大潜力。为了完成这部预告片,他绘制了5000张图画,并投入了10天的时间进行制作。这不仅是技术的挑战,也是对整个影视行业未来发展的深刻思考。
谷歌发布 “Vlogger” 视频模型框架:单张图片生成 10 秒视频
谷歌最近发布了一项名为“Vlogger”的新视频框架,可以通过仅一张图片和录音即可生成一个本人演讲视频。这一框架基于扩散模型,包含音频到人体动作和文本到图像模型两部分。随着技术的不断进步和完善,相信Vlogger将在未来有更广泛的应用和发展。
GitHub又火了一款AI工具 DUSt3R :2张图2秒钟3D 重建
一款名为DUSt3R的AI工具近日在GitHub上备受瞩目,其能够在短短2秒钟内通过仅有2张图片完成3D重建,让许多网友大呼惊奇,甚至认为这比之前热门的Sora更加实用。这一工具在单目/多视图深度估计以及相对位姿估计任务上表现出色,被认为是目前最先进的技术之一。这一技术的应用将极大地方便用户进行相关任务,带来更多可能性和创新。
阿里推声画同步框架EMO 1张图片加音频即可生成对口型视频
阿里巴巴智能计算研究所提出了一种新的生成式框架EMO,只需输入图片和音频即可生成具有表现力的视频视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配,但也可能成为造假的利器,因此一些名人可能需要警惕了。需要注意的是,该框架目前仅用于学术研究和效果演示有待进一步优化和扩展其应用范围。
谷歌发布基础世界模型Genie:11B参数,单张图生成可交互的虚拟世界
谷歌最新发布了基础世界模型Genie,这一模型拥有110亿参数,能够生成可交互的虚拟世界。Genie的出现让人们看到了人工智能在虚拟世界的无限可能性。Genie的出现将进一步推动虚拟世界的发展,为人类带来更多惊喜和可能性。
浙大团队推SIFU模型:单张图像准确重建高质量3D人体模型
在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,获得高质量穿着衣服的人体3D模型变得至关重要。传统的创建方法耗时且需要专业设备捕捉多视角照片依赖技术熟练的专业人员。SIFU模型为单张图片人体重建提供了一种创新的方法,为未来的研究和实际应用提供了新的思路。
阿里推开源版“妙鸭”FaceChain 1张图片百种定制
FaceChain-FACT是阿里推出的一项人工智能生成个性化肖像的技术,通过DeformableNeuralRadianceFields技术从普通视频中创造自由视点的肖像。使用FaceChainAI照片生成模型,不需要提供多张照片训练LoRA,仅需一张用户照片即可生成高度定制的肖像,生成速度更是快过商业应用100倍,达到秒级。这对于人工智能生成内容的发展具有积极的推动作用。
1张图2分钟转3D!纹理质量、多视角一致性新SOTA|北大出品
只需两分钟,玩转图片转3D!还是高纹理质量、多视角高一致性的那种。不管是什么物种,输入时的单视图图像还是这样婶儿的:两分钟后,3D版大功告成:△上,Repaint123;下,Repaint123新方法名为Repaint123,核心思想是将2D扩散模型的强大图像生成能力与再绘策略的纹理对齐能力相结合,来生成高质量、多视角一致的图像。作者也对论文使用的每个模块的有效性以及视角转动增量进行�
看见这张图没有,你就照着画:谷歌图像生成AI掌握多模态指令
用图2的风格画图1的猫猫并给它戴上一顶帽子。谷歌新设计的一种图像生成模型已经能做到这一点了!通过引入指令微调技术,多模态大模型可以根据文本指令描述的目标和多张参考图像准确生成新图像,效果堪比PS大神抓着你的手助你P图。请参阅原始论文以获取更多详细信息。