Captury创新3D体积扫描技术 实现真实动态捕捉
Captury公司近日推出了一项革命性的3D体积扫描技术,通过高分辨率摄像头实时捕捉纹理和网格数据,能够创建人物或物体的真实3D模型,无论是静止还是运动中的状态。这项技术的推出,无疑将对3D建模、动画制作、游戏开发等领域产生深远影响。这一技术的推出,将为3D建模、动画制作、游戏开发等领域带来新的可能。
AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
LangSplat:一种基于3D高斯技术提高3D语言查询交互任务效率
人与计算机的互动中,为用户与3D环境进行沟通创造方式变得越来越重要。开放式语言查询在3D中的应用包括机器人导航和操作、3D语义理解以及编辑,因此吸引了研究者的关注。随着研究人员进一步关注框架的准确性和速度,LangSplat有望重新塑造在三维空间中与信息进行交互和查询的方式。
InseRF技术:在图片中通过文本提示生成逼真的3D物体
瑞士苏黎世联邦理工学院和Google苏黎世的研究人员联合提出了一项名为InseRF的新技术,该技术引起了科技界的广泛关注。该技术通过文本提示和2D边界框,成功在3D场景中生成一致的物体,无需明确的3D信息。随着技术的不断发展和改进,InseRF有望成为未来生成式AI领域的重要技术之一。
实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部
BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。所有这些功能都能够在不牺牲渲染质量的情况下实时进行,对于需要快速反应和实时更新的应用非常重要。
SteinDreamer:改进的文本到3D生成技术 速度更快、纹理结构更精细
德克萨斯大学奥斯汀分校和MetaRealityLabs的研究人员联手推出了SteinDreamer,该技术集成了SteinScoreDistillation技术,以改进文本至3D生成领域的梯度估计高方差问题。这一技术的突破对于自动化和加速虚拟现实、电影和游戏中的3D资产创建具有重要意义。SteinDreamer通过SSD技术呈现出更丰富的纹理和较低级别的方差,相较于SDS产生了更少的过饱和和过度平滑的伪影。
腾讯推新技术Paint3D 给3D模型生成高清纹理
腾讯宣布推出一项名为Paint3D的技术,该技术在解决了生成没有内嵌光照信息的高质量纹理的挑战后,成为自动化纹理贴图生成领域的重大进展。Paint3D能够根据文本或图像输入,在无纹理的3D模型上生成高分辨率、无光照的多样化纹理贴图。更为重要的是,Paint3D生成的纹理贴图是没有内嵌光照阴影效果的,使得生成的纹理能够被重新照明或重新编辑,直接应用于现有的渲染管线
创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景
Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从重建现实世界场景。通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。这项技术的出现为模拟现实世界和创造逼真的虚拟环境提供了新的可能性。
细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型
MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。在模型结构上,引入了MaskedTransformer和ResidualTransformer,分别用于预测基础层的掩码动作标记和逐渐预测更高层次的标记。其在重建、生成和比较方面的实验证明了其在3D人体动作建模领域的卓越性能。
谷歌推3D生成模型CAT3D 1分钟完成3D场景创建
谷歌推出的CAT3D模型在3D重建领域取得了显著的进展,它通过使用多视角扩散模型来创建3D场景,提供了一种快速且高效的方法来生成3D内容。主要特点:快速生成:CAT3D能够在最短的时间内,即一分钟内完成整个3D场景的创建,这比现有的单图像和少视图3D场景创建方法要快得多。CAT3D的出现是3D重建技术的重大突破,它有潜力改变虚拟现实、游戏开发、建筑设计等多个行业,为用户
Midjourney团队公布进展:视频模型进展较慢 3D模型和实时生成效果显著
Midjourney团队在最近的工作时间透露了他们在视频模型、3D模型、实时生成效果以及网站和模型开发方面的最新进展。以下是他们透露的关键信息:图源备注:图片由AI生成,图片授权服务商Midjourney视频模型进展视频模型的开发进度并不如预期那样迅速。通过不断的技术迭代和功能更新,他们致力于为用户提供更加精准、高质量的AI技术产品。
Deep Paint:一款可以直接在3D空间中绘画的插件
DeepPaint是一个创新的插件,专为流行的3D建模和渲染软件Blender设计。它允许用户在3D空间内进行绘画,就像使用笔在纸上绘画一样,提供了一种全新的创作和编辑3D模型的方式。随着技术的进步,我们期待看到更多创新工具的出现,进一步激发创作者的想象力和创造力。
3D软件公司Autodesk发布AI生成3D功能Project Bernini
Adobe推3D图标工具 Project Neo 可快速2D转3D
Adobe公司最新推出的ProjectNeo,是一项革命性的3D技术,旨在通过3D元素和效果的整合,提升传统2D图形设计的视觉效果和制作效率。这项技术不仅让2D设计中的元素看起来具有深度和体积,更通过高效的工具和流程,极大地加快了设计的速度。ProjectNeo的先进光影处理功能,使用户能够自由组合形状,并通过光影效果增强矢量图形,轻松创造出接近现实的光影效果,从增加视觉的�
InstantMesh:新AI框架可在10秒内从2D图像生成高质量3D网格
根据研究团队发表的预印本文章,InstantMesh是由腾讯PCGARC实验室和上海科技大学的研究人员开发的人工智能框架,能够在仅需10秒的时间内,从单个2D图像生成高质量的3D网格。该开源框架由多视图扩散模型和3D网格重建模型组成,通过使用不同角度合成的3D视图来实现高质量的重建。这一技术有望显著提升3D行业生产力,尤其在视频游戏开发领域。
PhysDreamer:让3D物体符合物理规律动起来
在创建沉浸式虚拟体验时,实现真实物体交互至关重要。针对新型交互合成真实的3D物体动态仍然是一项重大挑战。PhysDreamer通过使静态3D物体能够以物理合理的方式动态响应互动刺激,迈出了向更具吸引力和真实感的虚拟体验的一步。
Interactive3D:可直接通过交互操作指导3D模型生成
Interactive3D技术为3D内容的创造和修改提供了一种极其灵活的方法。用户可以直接通过交互操作来指导3D模型的生成,这一过程不仅直观具有高度的创造性。无论是专业的3D设计师还是业余爱好者,都能通过这一技术轻松实现自己的创意构想。
港大与浙大联合研发SC-GS模型 鼠标拖拽实时可编辑3D重建
在数字资产创造和3D重建领域,香港大学CVMI实验室与3D大模型公司VAST以及浙江大学的联合研究团队提出了一项突破性成果——SC-GS模型。这一模型不仅在新视角合成领域掀起了革命性浪潮,更在动态场景的实时交互编辑方面展现了巨大潜力。他们期待在2024年看到更多基于高斯溅射技术的创新工作和探索。
百度地图V20 3D领先版预告:特斯拉全球首发、华为系也将用上
在今日举办的百度Apollo智能汽车产品发布会上,百度副总裁尚国斌表示,百度地图V20将在近期全面上线,支持车机端3D车道级导航。非常重磅的是,特斯拉在华的车型将首发搭载该地图,从5月开始,这一更新将陆续推送给新老特斯拉车主。值得一提的是,百度地图V203D领先版、旗舰版、SR智驾版,不仅支持iOS和安卓支持Linux、QX、鸿蒙等系统。
特斯拉将首发搭载百度地图V20 3D领先版 预计5月陆续推送
百度地图V20即将全面上线,并特别支持车机端的3D车道级导航功能。这一功能的推出,将为用户提供更加精准、直观的导航体验。随着百度地图V20的全面上线,我们期待看到更多车企和科技企业加入到这一领域,共同推动智能出行技术的发展。