周鸿祎称Sora生成视频堪比CG:未做3D建模 只需文字就可逼真描绘
今日,周鸿祎再次谈到Sora视频模型,他表示Sora生成视频堪比CG。周鸿祎发视频称,Sora有三个片段让他觉得非常惊讶。周鸿祎表示,Sora是记录文生视频AIGC的工具,它反映了AI对世界的理解,是从文字进入图像,再从图像展示对这个世界3D模型的理解。
Captury创新3D体积扫描技术 实现真实动态捕捉
Captury公司近日推出了一项革命性的3D体积扫描技术,通过高分辨率摄像头实时捕捉纹理和网格数据,能够创建人物或物体的真实3D模型,无论是静止还是运动中的状态。这项技术的推出,无疑将对3D建模、动画制作、游戏开发等领域产生深远影响。这一技术的推出,将为3D建模、动画制作、游戏开发等领域带来新的可能。
AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
LangSplat:一种基于3D高斯技术提高3D语言查询交互任务效率
人与计算机的互动中,为用户与3D环境进行沟通创造方式变得越来越重要。开放式语言查询在3D中的应用包括机器人导航和操作、3D语义理解以及编辑,因此吸引了研究者的关注。随着研究人员进一步关注框架的准确性和速度,LangSplat有望重新塑造在三维空间中与信息进行交互和查询的方式。
InseRF技术:在图片中通过文本提示生成逼真的3D物体
瑞士苏黎世联邦理工学院和Google苏黎世的研究人员联合提出了一项名为InseRF的新技术,该技术引起了科技界的广泛关注。该技术通过文本提示和2D边界框,成功在3D场景中生成一致的物体,无需明确的3D信息。随着技术的不断发展和改进,InseRF有望成为未来生成式AI领域的重要技术之一。
实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部
BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。所有这些功能都能够在不牺牲渲染质量的情况下实时进行,对于需要快速反应和实时更新的应用非常重要。
SteinDreamer:改进的文本到3D生成技术 速度更快、纹理结构更精细
德克萨斯大学奥斯汀分校和MetaRealityLabs的研究人员联手推出了SteinDreamer,该技术集成了SteinScoreDistillation技术,以改进文本至3D生成领域的梯度估计高方差问题。这一技术的突破对于自动化和加速虚拟现实、电影和游戏中的3D资产创建具有重要意义。SteinDreamer通过SSD技术呈现出更丰富的纹理和较低级别的方差,相较于SDS产生了更少的过饱和和过度平滑的伪影。
腾讯推新技术Paint3D 给3D模型生成高清纹理
腾讯宣布推出一项名为Paint3D的技术,该技术在解决了生成没有内嵌光照信息的高质量纹理的挑战后,成为自动化纹理贴图生成领域的重大进展。Paint3D能够根据文本或图像输入,在无纹理的3D模型上生成高分辨率、无光照的多样化纹理贴图。更为重要的是,Paint3D生成的纹理贴图是没有内嵌光照阴影效果的,使得生成的纹理能够被重新照明或重新编辑,直接应用于现有的渲染管线
创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景
Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从重建现实世界场景。通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。这项技术的出现为模拟现实世界和创造逼真的虚拟环境提供了新的可能性。
细粒度文字转动画技术MoMask 文本驱动的3D人体运动生成模型
MoMask是一个创新的3D人体运动生成模型,其核心思想是通过层级量化方案表示人体动作,包括基础层和逐层的残差标记。在模型结构上,引入了MaskedTransformer和ResidualTransformer,分别用于预测基础层的掩码动作标记和逐渐预测更高层次的标记。其在重建、生成和比较方面的实验证明了其在3D人体动作建模领域的卓越性能。
三星将推出先进的 3D AI 芯片封装技术 SAINT 与台积电竞争
三星电子计划于明年推出一项先进的三维芯片封装技术,以与代工龙头台积电展开竞争。总部位于韩国水原市的这家芯片制造商将使用该技术——SAINT——来集成高性能芯片所需的存储器和处理器,包括AI芯片,并大幅减小其尺寸。三星的新SAINT技术旨在提高数据中心和移动APs中AI芯片的性能,这些APs具有设备内AI功能,消息人士表示。
即时3D搜索技术OVIR-3D开源 可从文本提示中检索3D对象
OVIR-3D是一个开放词汇的3D实例检索系统,它以直观有效的方式解决了在没有对3D数据进行训练的情况下获取3D实例的问题。该系统通过语言引导的2D区域提议进行3D融合,为机器人应用提供了解决方案。文章还提到了OVIR-3D的应用前景,以及后续工作OVSG的介绍,该工作在OVIR-3D的基础上构建3D场景图,实现更精准的对象检索。
NeRF技术:一种新的视频转3D模型技术
使用NeuralRadianceFields技术将标准RGB视频素材转化为可控制的3D模型,为数字人物的制作提供了崭新的途径。制作逼真的3D模型需要昂贵的设备和繁琐的手工建模,使其在一般情况下难以实现。这一领域的发展有望为游戏、虚拟现实和电影等行业带来更具成本效益和高效的数字人物制作方法。
新NeRF技术:将视频转化为可控制的3D模型 创建数字人更简单了
FraunhoferHeinrichHertz研究团队取得重大突破,他们引入了一项全新技术,使用神经辐射场将标准RGB视频转化为可控制的3D人体模型。这一创新代表了计算机图形领域中的一项重要进展,解决了从视频片段中创建逼真、可控制的3D模型一直以来的难题。这项工作将数字人物的创建变得更加可行,为个人创作者和小型制作团队带来更多应用可能性。
今日AI:多模态大模型Claude3发布;Gorq API开放申请;ChatGPT新增朗读功能;Stability AI发布SD3技术报告
欢迎来到【今日AI】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
AI研究也能借鉴印象派?D3GA全新虚拟建模技术亮了
一项名为D3GA的技术引起了人们的关注,该技术在虚拟角色建模领域带来了创新。D3GA通过创造性地运用高斯泼溅技术,实现了逼真、动态虚拟角色的构建。D3GA有望为虚拟角色的逼真表现和动态驱动带来更多可能性。
一加Ace 3或将配备1.5K曲面屏 支持明眸护眼技术
根据数码博主“数码闲聊站”的爆料,一加Ace3将采用一块6.78英寸的屏幕,配备金属中框和玻璃机身,提供粉色、灰色和蓝色等多种配色可选。这款屏幕是由一加与京东方联合研发的1.5K东方屏,被认为是在行业内最好的1.5K屏幕。这款手机预计在春节前正式发布,起售价预计在2500-3000元之间。
联发科新芯片天玑 8300 将 ChatGPT 类似的人工智能技术带到更实惠的手机上
芯片制造商联发科最近推出了旗舰级的天玑9300移动芯片,将在高端安卓手机中实现本地生成式人工智能功能。该公司正式发布了新芯片天玑8300,将为更实惠的手机提供同样的功能。小米已经确认红米K70E将于本月晚些时候推出天玑8300。
InstantMesh:只需10秒就能从图片转3D模型
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型的稀疏视图重建技术,极大地优化了3D资产的创建过程。InstantMesh的出现,预示着3D建模和可视化领域将迎来新的变革,它将极大地提高工作效率,降低技术门槛,使得更多的人能够参与到3D内容的创作中来。
Spline发布3D生成工具AI 3D Generation 支持文/图生3D模型及混合编辑3D模型
Spline的最新3D生成工具的发布,标志着3D设计领域的一次重大进步。这款在线3D编辑工具不仅支持从文字和图片生成3D模型能够混合和编辑3D模型,为用户提供了一个全面强大的3D设计解决方案。这意味着用户可以始终接触到行业的最新趋势,并将这些新功能应用到自己的项目中,保持创作的前沿性和创新性。