Captury创新3D体积扫描技术 实现真实动态捕捉
Captury公司近日推出了一项革命性的3D体积扫描技术,通过高分辨率摄像头实时捕捉纹理和网格数据,能够创建人物或物体的真实3D模型,无论是静止还是运动中的状态。这项技术的推出,无疑将对3D建模、动画制作、游戏开发等领域产生深远影响。这一技术的推出,将为3D建模、动画制作、游戏开发等领域带来新的可能。
AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
LangSplat:一种基于3D高斯技术提高3D语言查询交互任务效率
人与计算机的互动中,为用户与3D环境进行沟通创造方式变得越来越重要。开放式语言查询在3D中的应用包括机器人导航和操作、3D语义理解以及编辑,因此吸引了研究者的关注。随着研究人员进一步关注框架的准确性和速度,LangSplat有望重新塑造在三维空间中与信息进行交互和查询的方式。
InseRF技术:在图片中通过文本提示生成逼真的3D物体
瑞士苏黎世联邦理工学院和Google苏黎世的研究人员联合提出了一项名为InseRF的新技术,该技术引起了科技界的广泛关注。该技术通过文本提示和2D边界框,成功在3D场景中生成一致的物体,无需明确的3D信息。随着技术的不断发展和改进,InseRF有望成为未来生成式AI领域的重要技术之一。
实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部
BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。所有这些功能都能够在不牺牲渲染质量的情况下实时进行,对于需要快速反应和实时更新的应用非常重要。
SteinDreamer:改进的文本到3D生成技术 速度更快、纹理结构更精细
德克萨斯大学奥斯汀分校和MetaRealityLabs的研究人员联手推出了SteinDreamer,该技术集成了SteinScoreDistillation技术,以改进文本至3D生成领域的梯度估计高方差问题。这一技术的突破对于自动化和加速虚拟现实、电影和游戏中的3D资产创建具有重要意义。SteinDreamer通过SSD技术呈现出更丰富的纹理和较低级别的方差,相较于SDS产生了更少的过饱和和过度平滑的伪影。
腾讯推新技术Paint3D 给3D模型生成高清纹理
腾讯宣布推出一项名为Paint3D的技术,该技术在解决了生成没有内嵌光照信息的高质量纹理的挑战后,成为自动化纹理贴图生成领域的重大进展。Paint3D能够根据文本或图像输入,在无纹理的3D模型上生成高分辨率、无光照的多样化纹理贴图。更为重要的是,Paint3D生成的纹理贴图是没有内嵌光照阴影效果的,使得生成的纹理能够被重新照明或重新编辑,直接应用于现有的渲染管线
创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景
Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从重建现实世界场景。通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。这项技术的出现为模拟现实世界和创造逼真的虚拟环境提供了新的可能性。
细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型
MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。在模型结构上,引入了MaskedTransformer和ResidualTransformer,分别用于预测基础层的掩码动作标记和逐渐预测更高层次的标记。其在重建、生成和比较方面的实验证明了其在3D人体动作建模领域的卓越性能。
三星将推出先进的 3D AI 芯片封装技术 SAINT 与台积电竞争
三星电子计划于明年推出一项先进的三维芯片封装技术,以与代工龙头台积电展开竞争。总部位于韩国水原市的这家芯片制造商将使用该技术——SAINT——来集成高性能芯片所需的存储器和处理器,包括AI芯片,并大幅减小其尺寸。三星的新SAINT技术旨在提高数据中心和移动APs中AI芯片的性能,这些APs具有设备内AI功能,消息人士表示。
即时3D搜索技术OVIR-3D开源 可从文本提示中检索3D对象
OVIR-3D是一个开放词汇的3D实例检索系统,它以直观有效的方式解决了在没有对3D数据进行训练的情况下获取3D实例的问题。该系统通过语言引导的2D区域提议进行3D融合,为机器人应用提供了解决方案。文章还提到了OVIR-3D的应用前景,以及后续工作OVSG的介绍,该工作在OVIR-3D的基础上构建3D场景图,实现更精准的对象检索。
NeRF技术:一种新的视频转3D模型技术
使用NeuralRadianceFields技术将标准RGB视频素材转化为可控制的3D模型,为数字人物的制作提供了崭新的途径。制作逼真的3D模型需要昂贵的设备和繁琐的手工建模,使其在一般情况下难以实现。这一领域的发展有望为游戏、虚拟现实和电影等行业带来更具成本效益和高效的数字人物制作方法。
新NeRF技术:将视频转化为可控制的3D模型 创建数字人更简单了
FraunhoferHeinrichHertz研究团队取得重大突破,他们引入了一项全新技术,使用神经辐射场将标准RGB视频转化为可控制的3D人体模型。这一创新代表了计算机图形领域中的一项重要进展,解决了从视频片段中创建逼真、可控制的3D模型一直以来的难题。这项工作将数字人物的创建变得更加可行,为个人创作者和小型制作团队带来更多应用可能性。
InstantMesh:只需10秒就能从图片转3D模型
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型的稀疏视图重建技术,极大地优化了3D资产的创建过程。InstantMesh的出现,预示着3D建模和可视化领域将迎来新的变革,它将极大地提高工作效率,降低技术门槛,使得更多的人能够参与到3D内容的创作中来。
Spline发布3D生成工具AI 3D Generation 支持文/图生3D模型及混合编辑3D模型
Spline的最新3D生成工具的发布,标志着3D设计领域的一次重大进步。这款在线3D编辑工具不仅支持从文字和图片生成3D模型能够混合和编辑3D模型,为用户提供了一个全面强大的3D设计解决方案。这意味着用户可以始终接触到行业的最新趋势,并将这些新功能应用到自己的项目中,保持创作的前沿性和创新性。
在线3D视频编辑工具使用地址 Lumiere官网地址
Lumiere3DAI是一个强大的在线视频编辑工具,专注于提供优化的3D产品视频,适用于reels、shorts和TikTok等平台。通过定制音乐、摄影角度和场景,您可以轻松展现您产品的优势。Lumiere3DAI的出现,为用户提供了一个便捷强大的工具,帮助他们打造引人注目的3D产品视频,从在竞争激烈的市场中脱颖出。
Meta 推出 ViewDiff 模型:文本生成多视角 3D 图像
Meta与德国慕尼黑工业大学研发出创新模型ViewDiff,旨在帮助用户通过文本、图像或二者结合使用,快速生成高质量多视角3D图像。该模型解决了传统文本生成多视角3D图像领域的三大难点:无法生成真实背景环境、图像质量和多样性不理想、缺乏多视角和一致性。该模型的推出不仅在技术层面上具有重大意义,也将为未来的3D图像生成领域带来更多创新可能。
DiffHuman官网体验入口 3D人体建模软件使用方法教程指南
DiffHuman是一种概率性的光度逼真的3D人体重建方法。它可以从单张RGB图像预测一个3D人体重建的概率分布,并通过迭代降噪采样多个细节丰富、色彩鲜明的3D人体模型。要获取更多详细信息并开始使用DiffHuman,请访问DiffHuman官方网站。
Lixel CyberColor:自动生成无限大的电影级效果的3D场景
LixelCyberColor,由XGRIDS公司研发的这款先进技术产品,正在为3D场景的创建带来革命性的变化。LCC能够自动生成具有电影级效果的无限大3D场景,这一成就得益于它采用的Multi-SLAM和高斯溅射技术。随着XGRIDS技术的不断进步,我们有理由相信,未来的虚拟世界将变得更加真实,更加引人入胜。
三星谋划3D堆叠内存:10nm以下一路奔向2032年
3D晶体管正在各种类型芯片中铺开,3DDRAM内存也讨论了很多年,但一直没有落地。如今三星公开的路线图上,终于出现了3DDRAM。大约2030-2031年的时候,三星将升级到堆叠DRAM,将多组VCT堆在一起,从获得更大容量、更高性能,看起来还会引入电容器作为辅助。