LangSplat:一种基于3D高斯技术提高3D语言查询交互任务效率
人与计算机的互动中,为用户与3D环境进行沟通创造方式变得越来越重要。开放式语言查询在3D中的应用包括机器人导航和操作、3D语义理解以及编辑,因此吸引了研究者的关注。随着研究人员进一步关注框架的准确性和速度,LangSplat有望重新塑造在三维空间中与信息进行交互和查询的方式。
CHOIS:基于语言引导的合成逼真3D人机交互的AI方法
斯坦福大学与FAIRMeta的研究人员合作开发的CHOIS系统,通过引入基于语言描述、初始状态和稀疏对象航点的方法,成功解决了在3D场景中生成对象和人物同步运动的难题。该系统通过在指定的3D环境中产生逼真且可控的运动,控制了人物与对象之间的交互。将学到的交互模块应用于基于3D场景对象航点生成长期交互也将拓展CHOIS的适用性。
SAGA:毫秒实现3D高斯交互分割,加速近1000倍
在当今数字化时代,视觉技术一直是科技创新的关键驱动力。为了解决现有方法在3D场景理解和操作中面临的挑战,来自上海交通大学人工智能研究所和华为公司的团队推出了一项引领性的科技突破。SAGA通过巧妙融合2D分割和3D高斯技术,以高效、快速的方式实现了3D场景的交互式分割,克服了以往方法的一些挑战。
阿里推文生3D数字人项目Make-A-Character 人人皆成3D角色设计师
阿里又推“黑科技”!这次瞄准了文生3D人。Make-A-Character支持一句话生成超逼真的3D数字人。通过这些步骤,MACH可以快速从简单的文本描述中生成逼真的、完整的、可动画化的3D角色,适用于各种娱乐和专业场景。