Captury创新3D体积扫描技术 实现真实动态捕捉
Captury公司近日推出了一项革命性的3D体积扫描技术,通过高分辨率摄像头实时捕捉纹理和网格数据,能够创建人物或物体的真实3D模型,无论是静止还是运动中的状态。这项技术的推出,无疑将对3D建模、动画制作、游戏开发等领域产生深远影响。这一技术的推出,将为3D建模、动画制作、游戏开发等领域带来新的可能。
AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
LangSplat:一种基于3D高斯技术提高3D语言查询交互任务效率
人与计算机的互动中,为用户与3D环境进行沟通创造方式变得越来越重要。开放式语言查询在3D中的应用包括机器人导航和操作、3D语义理解以及编辑,因此吸引了研究者的关注。随着研究人员进一步关注框架的准确性和速度,LangSplat有望重新塑造在三维空间中与信息进行交互和查询的方式。
InseRF技术:在图片中通过文本提示生成逼真的3D物体
瑞士苏黎世联邦理工学院和Google苏黎世的研究人员联合提出了一项名为InseRF的新技术,该技术引起了科技界的广泛关注。该技术通过文本提示和2D边界框,成功在3D场景中生成一致的物体,无需明确的3D信息。随着技术的不断发展和改进,InseRF有望成为未来生成式AI领域的重要技术之一。
实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部
BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。所有这些功能都能够在不牺牲渲染质量的情况下实时进行,对于需要快速反应和实时更新的应用非常重要。
SteinDreamer:改进的文本到3D生成技术 速度更快、纹理结构更精细
德克萨斯大学奥斯汀分校和MetaRealityLabs的研究人员联手推出了SteinDreamer,该技术集成了SteinScoreDistillation技术,以改进文本至3D生成领域的梯度估计高方差问题。这一技术的突破对于自动化和加速虚拟现实、电影和游戏中的3D资产创建具有重要意义。SteinDreamer通过SSD技术呈现出更丰富的纹理和较低级别的方差,相较于SDS产生了更少的过饱和和过度平滑的伪影。
腾讯推新技术Paint3D 给3D模型生成高清纹理
腾讯宣布推出一项名为Paint3D的技术,该技术在解决了生成没有内嵌光照信息的高质量纹理的挑战后,成为自动化纹理贴图生成领域的重大进展。Paint3D能够根据文本或图像输入,在无纹理的3D模型上生成高分辨率、无光照的多样化纹理贴图。更为重要的是,Paint3D生成的纹理贴图是没有内嵌光照阴影效果的,使得生成的纹理能够被重新照明或重新编辑,直接应用于现有的渲染管线
创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景
Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从重建现实世界场景。通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。这项技术的出现为模拟现实世界和创造逼真的虚拟环境提供了新的可能性。
细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型
MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。在模型结构上,引入了MaskedTransformer和ResidualTransformer,分别用于预测基础层的掩码动作标记和逐渐预测更高层次的标记。其在重建、生成和比较方面的实验证明了其在3D人体动作建模领域的卓越性能。
三星将推出先进的 3D AI 芯片封装技术 SAINT 与台积电竞争
三星电子计划于明年推出一项先进的三维芯片封装技术,以与代工龙头台积电展开竞争。总部位于韩国水原市的这家芯片制造商将使用该技术——SAINT——来集成高性能芯片所需的存储器和处理器,包括AI芯片,并大幅减小其尺寸。三星的新SAINT技术旨在提高数据中心和移动APs中AI芯片的性能,这些APs具有设备内AI功能,消息人士表示。
即时3D搜索技术OVIR-3D开源 可从文本提示中检索3D对象
OVIR-3D是一个开放词汇的3D实例检索系统,它以直观有效的方式解决了在没有对3D数据进行训练的情况下获取3D实例的问题。该系统通过语言引导的2D区域提议进行3D融合,为机器人应用提供了解决方案。文章还提到了OVIR-3D的应用前景,以及后续工作OVSG的介绍,该工作在OVIR-3D的基础上构建3D场景图,实现更精准的对象检索。
NeRF技术:一种新的视频转3D模型技术
使用NeuralRadianceFields技术将标准RGB视频素材转化为可控制的3D模型,为数字人物的制作提供了崭新的途径。制作逼真的3D模型需要昂贵的设备和繁琐的手工建模,使其在一般情况下难以实现。这一领域的发展有望为游戏、虚拟现实和电影等行业带来更具成本效益和高效的数字人物制作方法。
新NeRF技术:将视频转化为可控制的3D模型 创建数字人更简单了
FraunhoferHeinrichHertz研究团队取得重大突破,他们引入了一项全新技术,使用神经辐射场将标准RGB视频转化为可控制的3D人体模型。这一创新代表了计算机图形领域中的一项重要进展,解决了从视频片段中创建逼真、可控制的3D模型一直以来的难题。这项工作将数字人物的创建变得更加可行,为个人创作者和小型制作团队带来更多应用可能性。
Interactive3D:可直接通过交互操作指导3D模型生成
Interactive3D技术为3D内容的创造和修改提供了一种极其灵活的方法。用户可以直接通过交互操作来指导3D模型的生成,这一过程不仅直观具有高度的创造性。无论是专业的3D设计师还是业余爱好者,都能通过这一技术轻松实现自己的创意构想。
港大与浙大联合研发SC-GS模型 鼠标拖拽实时可编辑3D重建
在数字资产创造和3D重建领域,香港大学CVMI实验室与3D大模型公司VAST以及浙江大学的联合研究团队提出了一项突破性成果——SC-GS模型。这一模型不仅在新视角合成领域掀起了革命性浪潮,更在动态场景的实时交互编辑方面展现了巨大潜力。他们期待在2024年看到更多基于高斯溅射技术的创新工作和探索。
百度地图V20 3D领先版预告:特斯拉全球首发、华为系也将用上
在今日举办的百度Apollo智能汽车产品发布会上,百度副总裁尚国斌表示,百度地图V20将在近期全面上线,支持车机端3D车道级导航。非常重磅的是,特斯拉在华的车型将首发搭载该地图,从5月开始,这一更新将陆续推送给新老特斯拉车主。值得一提的是,百度地图V203D领先版、旗舰版、SR智驾版,不仅支持iOS和安卓支持Linux、QX、鸿蒙等系统。
特斯拉将首发搭载百度地图V20 3D领先版 预计5月陆续推送
百度地图V20即将全面上线,并特别支持车机端的3D车道级导航功能。这一功能的推出,将为用户提供更加精准、直观的导航体验。随着百度地图V20的全面上线,我们期待看到更多车企和科技企业加入到这一领域,共同推动智能出行技术的发展。
InstantMesh:只需10秒就能从图片转3D模型
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型的稀疏视图重建技术,极大地优化了3D资产的创建过程。InstantMesh的出现,预示着3D建模和可视化领域将迎来新的变革,它将极大地提高工作效率,降低技术门槛,使得更多的人能够参与到3D内容的创作中来。
Spline发布3D生成工具AI 3D Generation 支持文/图生3D模型及混合编辑3D模型
Spline的最新3D生成工具的发布,标志着3D设计领域的一次重大进步。这款在线3D编辑工具不仅支持从文字和图片生成3D模型能够混合和编辑3D模型,为用户提供了一个全面强大的3D设计解决方案。这意味着用户可以始终接触到行业的最新趋势,并将这些新功能应用到自己的项目中,保持创作的前沿性和创新性。
在线3D视频编辑工具使用地址 Lumiere官网地址
Lumiere3DAI是一个强大的在线视频编辑工具,专注于提供优化的3D产品视频,适用于reels、shorts和TikTok等平台。通过定制音乐、摄影角度和场景,您可以轻松展现您产品的优势。Lumiere3DAI的出现,为用户提供了一个便捷强大的工具,帮助他们打造引人注目的3D产品视频,从在竞争激烈的市场中脱颖出。