谷歌开发实时渲染大型三维场景技术SMERF
Google团队开发了一种名为SMERF的技术,可以在最大300平方米的房间内实时创建非常逼真的三维场景,其精度达到厘米级别。这项技术的最大特点是,它可以在普通智能手机和笔记本电脑上实现60fps或更高的速度实时渲染,并提供完整的六自由度3D导航体验。这项技术的出现将为用户带来更加真实、流畅的三维体验无需昂贵的设备,只需普通的智能手机和笔记本电脑即可。
首个三维具身通才智能体LEO:全面掌握感知、推理、规划、行动
多模态大语言模型在自然语言处理、视觉理解和机器人领域取得了显著进展。这些模型主要基于二维图片和文本数据,对于理解和交互于三维世界的任务存在一定的欠缺。LEO的出现标志着具身通才智能体在三维世界任务上取得了新的突破,为实现通用人工智能迈出了重要一步。