谷歌开发实时渲染大型三维场景技术SMERF
Google团队开发了一种名为SMERF的技术,可以在最大300平方米的房间内实时创建非常逼真的三维场景,其精度达到厘米级别。这项技术的最大特点是,它可以在普通智能手机和笔记本电脑上实现60fps或更高的速度实时渲染,并提供完整的六自由度3D导航体验。这项技术的出现将为用户带来更加真实、流畅的三维体验无需昂贵的设备,只需普通的智能手机和笔记本电脑即可。
首个三维具身通才智能体LEO:全面掌握感知、推理、规划、行动
多模态大语言模型在自然语言处理、视觉理解和机器人领域取得了显著进展。这些模型主要基于二维图片和文本数据,对于理解和交互于三维世界的任务存在一定的欠缺。LEO的出现标志着具身通才智能体在三维世界任务上取得了新的突破,为实现通用人工智能迈出了重要一步。
IDC发布数据要素全景研究 蚂蚁数科入选代表技术厂商
全球权威研究机构IDC发布《数据要素全景研究》,对当前数据要素市场的主要需求、市场活动、参与主体、落地形式等情况进行分析,并列举了市场代表性的技术架构及应用案例为产品选型提供参考。蚂蚁数科以技术服务的完整性入选代表技术厂商。蚂蚁数科已在政务与公共服务、工业能源、物流贸易、金融等众多领域中开展数据应用场景实践和探索,已落地超90个场景化解决方案,为数据要素市场的数据管理、流通和应用提供安全、可信、高效的技术支撑。
全新视频全景分割技术MaXTron
MaXTron是一种专为视频分割设计的先进的元架构,通过无缝集成片内和片间跟踪模块,提升了分割结果的时间一致性。其统一的元架构简化了分割过程,使其成为计算机视觉领域研究人员和从业者的有效工具。片间跟踪模块:交叉片段跟踪模块将跟踪能力扩展到个别片段之外,促进整个视频序列的协调分割结果。
360度全景成像混合技术实现开源
研究人员最近设计出一种独特的圆形混合技术,以解决创建无缝360度全景图像的难题。360度全景图像一直是一个具有挑战性的技术难题。通过这项技术,用户可以更好地了解一个地点的全貌,提前感受到真实环境的氛围,从做出更准确的决策。