Meta提出TextureDreamer:利用扩散模型生成完整的3D模型纹理贴图
高质量的3D内容对于AR/VR、机器人技术、电影和游戏等应用至关重要。纹理的创作一直是视觉和图形领域的挑战之一。通过对Dreambooth、ControlNet和分数蒸馏等关键技术的综合应用,TextureDreamer展现了在图像引导纹理合成领域的卓越性能。
InstantMesh:只需10秒就能从图片转3D模型
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型的稀疏视图重建技术,极大地优化了3D资产的创建过程。InstantMesh的出现,预示着3D建模和可视化领域将迎来新的变革,它将极大地提高工作效率,降低技术门槛,使得更多的人能够参与到3D内容的创作中来。
Spline发布3D生成工具AI 3D Generation 支持文/图生3D模型及混合编辑3D模型
Spline的最新3D生成工具的发布,标志着3D设计领域的一次重大进步。这款在线3D编辑工具不仅支持从文字和图片生成3D模型能够混合和编辑3D模型,为用户提供了一个全面强大的3D设计解决方案。这意味着用户可以始终接触到行业的最新趋势,并将这些新功能应用到自己的项目中,保持创作的前沿性和创新性。
Meta 推出 ViewDiff 模型:文本生成多视角 3D 图像
Meta与德国慕尼黑工业大学研发出创新模型ViewDiff,旨在帮助用户通过文本、图像或二者结合使用,快速生成高质量多视角3D图像。该模型解决了传统文本生成多视角3D图像领域的三大难点:无法生成真实背景环境、图像质量和多样性不理想、缺乏多视角和一致性。该模型的推出不仅在技术层面上具有重大意义,也将为未来的3D图像生成领域带来更多创新可能。
GRM:只需少量图片,就能在0.1秒内创建3D模型
一款名为GRM的大型高斯重建模型引起了广泛关注。GRM是一种用于3D重建和生成的技术,通过有效整合多视角信息,它能够在极短的时间内重建出精确的3D模型。随着技术的不断发展,我们有理由相信,GRM将为3D建模技术的应用带来更多可能性。
Garment3DGen:用衣服图片就能生成逼纹理效果的3D模型
研究人员提出了一种名为Garment3DGen的方法,旨在实现3D服装的风格化和纹理生成。该方法通过结合先进的计算机视觉技术和人工智能算法,为用户提供了一个简单高效的工具,用于实现服装设计的个性化风格化。随着这一技术的不断完善和推广,我们有理由相信,未来的服装设计将更加多样化和个性化。
Champ:基于3D的人物图片转视频动画
在数字媒体和娱乐行业,如何将静态的人物图片转化为动态的视频一直是一个挑战。一项名为Champ的新技术,让这个任务变得简单高效。无论在任何场景下,只要有合适的输入,Champ都能生成逼真的人类动画。
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放
3D生成领域迎来新的「SOTA级选手」,支持商用和非商用。StabilityAI的大模型家族来了一位新成员。更多技术细节和实验结果请参阅原论文。
Stability AI推Stable Video3D(SV3D)传图可生成3D视频
StabilityAI推出了StableVideo3D,这是一款用于生成3D视频的新型genAI工具。SV3D是在稳定AI之前的StableVideo技术基础上开发的,该技术使用户能够从图像或文本提示中生成短视频。SV3D_p则扩展了这一功能,既可以使用单个图像,也可以使用轨道视图,允许用户沿指定的摄像机路径创建3D视频。
CRM官网体验入口 AI图像处理3D建模神器免费在线使用地址
CRM是一个高保真的单图像到3D纹理网格的生成模型,它通过整合几何先验到网络设计中,能够从单个输入图像生成六个正交视图图像,然后利用卷积U-Net创建高分辨率的三平面。CRM进一步使用Flexicubes作为几何表示,便于在纹理网格上进行直接的端到端优化。要获取更多详细信息并开始使用CRM,请访问CRM官方网站。
CRM:上传图片生成3D模型,10秒搞定
清华大学的研究团队在图像处理领域取得了重要进展,他们提出了一种名为ConvolutionalReconstructionModel的前馈式单图像到3D纹理网格生成模型。与传统的大型重建模型相比,CRM在生成速度上表现出色,同时克服了基于Transformer的方法在几何先验方面存在的不足。这一项研究为单图像到3D纹理网格的生成提供了一种新的前馈式模型,具有卓越的速度和质量,为图像处理领域带来了新的
GitHub又火了一款AI工具 DUSt3R :2张图2秒钟3D 重建
一款名为DUSt3R的AI工具近日在GitHub上备受瞩目,其能够在短短2秒钟内通过仅有2张图片完成3D重建,让许多网友大呼惊奇,甚至认为这比之前热门的Sora更加实用。这一工具在单目/多视图深度估计以及相对位姿估计任务上表现出色,被认为是目前最先进的技术之一。这一技术的应用将极大地方便用户进行相关任务,带来更多可能性和创新。
多视角高斯模型LGM:5秒产出高质量3D物体 支持图文到3D
由北京大学、南洋理工大学S-Lab和上海人工智能实验室联合研究的团队推出的大型多视角高斯模型引起广泛关注。LGM以其核心模块LargeMulti-ViewGaussianModel为基础,采用了一种新颖的方法,能够在仅5秒的时间内从单一视角图片或文本输入中生成高分辨率高质量的3D物体。LGM通过创新的3D表示和骨干结构,以及高效的训练方法,实现了在高分辨率3D内容生成方面的显著进展。
周鸿祎称Sora生成视频堪比CG:未做3D建模 只需文字就可逼真描绘
今日,周鸿祎再次谈到Sora视频模型,他表示Sora生成视频堪比CG。周鸿祎发视频称,Sora有三个片段让他觉得非常惊讶。周鸿祎表示,Sora是记录文生视频AIGC的工具,它反映了AI对世界的理解,是从文字进入图像,再从图像展示对这个世界3D模型的理解。
ComfyUI发布最新3D Pack 可快速将图片转换为3D模型
ComfyUI最新的3DPack现已发布,让用户可以快速将图片转换为3D模型,并在RTX3080GPU上不到30秒内完成。这一新功能让用户能够直观地查看3D模型,并自动创建多个相机角度,从各种方向全方位地查看3D模型。这一新功能无疑将为用户带来全新的体验和方便,让他们能够更好地应用3D技术于各种领域中。
混合现实社交平台Wooorld 将3D世界地图带入用户的房间
Wooorld,一款基于MetaQuest混合现实技术的社交平台,为用户带来了全新的虚拟体验。通过混合现实技术,Wooorld将一个3D的世界地图带入用户的房间,不仅允许用户探索世界提供了多样化的游戏功能,其中包括能够将用户随机传送到170个国家不同位置的有趣游戏。这使得Wooorld成为一款兼顾探险和游戏的综合性社交平台,为用户带来了全新的虚拟社交体验。
SIFU官网体验入口 AI图像3D虚拟人物服装重建在线使用地址
SIFU是一种先进的计算机视觉技术,专门用于通过侧视图像重建高质量的3D服装虚拟人物模型。这种方法的核心创新在于提出了一种新型基于侧视图像的隐式函数,能够有效增强特征提取和提高几何精度。要了解更多信息并体验这项革新技术,请访问SIFU官方网站。
浙大团队推SIFU模型:单张图像准确重建高质量3D人体模型
在AR、VR、3D打印、场景搭建以及电影制作等多个领域中,获得高质量穿着衣服的人体3D模型变得至关重要。传统的创建方法耗时且需要专业设备捕捉多视角照片依赖技术熟练的专业人员。SIFU模型为单张图片人体重建提供了一种创新的方法,为未来的研究和实际应用提供了新的思路。
浙大提出SIFU模型 单图即可重建高质量3D人体模型
浙江大学ReLER实验室的研究人员提出了一项引人瞩目的研究成果:SIFU模型。该模型创新性地使用单张图片进行3D人体模型重建,通过引入侧视图条件隐函数和扩散模型,实现了几何和纹理重建的最先进水平。通过这一研究,浙江大学ReLER实验室为几何纹理重建领域注入了新的SOTA技术,为未来的科研和产业应用提供了坚实的基础。
特斯拉推送2023.44.30.8更新:支持倒车3D图像、语音更智能
特斯拉宣布即将进行一次重要的OTA软件更新,推出2023.44.30.8版本。此次更新在安全性、智能化和娱乐性等方面都有显著提升。驾驶员可以选择搞怪的锁车声音、节日灯光秀以及其他几款新游戏来点缀驾驶旅程。