DL3DV-10K数据集:可用于深度学习的3D视觉大规模场景
神经视图合成在从多视图视频生成逼真的三维场景方面提出了复杂的挑战,尤其是在多样化的真实世界场景中。当前先进的NVS技术在面对照明变化、反射、透明度和整体场景复杂性的变化时,其局限性变得明显。数据集的先进和方法学创新的结合推动该领域朝着更加强大和多功能的神经视图合成能力迈进。
联合国科技大会关注大模型安全,蚂蚁集团深度参编的两项国际标准发布
4月15日-19日,第27届联合国科技大会在瑞士日内瓦召开。16日,在以“塑造AI的未来”为主题的AI边会上,世界数字技术院发布了一系列突破性成果,包括《生成式人工智能应用安全测试标准》和《大语言模型安全测试方法》两项国际标准。蚂蚁集团在公司内成立了科技伦理委员会和专门团队来评估和管理生成式AI的风险,公司所有AI产品均需通过科技伦理评测机制,确保AI安全可
自动化写作工具STORM:可生成像维基百科一样的深度长篇内容
STORM是由斯坦福大学开发的创新性自动化写作工具,旨在从头开始编写具有广度和深度的长篇文章,类似于维基百科中的内容。这个工具通过互联网搜索自动搜集资料,并模拟专家与作者之间的对话来生成结构化的文章大纲,最终产生完整的、经过润色的文章。这包括去除重复信息、增加总结部分等,以提高文章的整体质量。
哀悼!55岁商汤科技创始人汤晓鸥突然离世,他撑起中国计算机视觉研究半壁江山
【新智元导读】商汤科技创始人、著名人工智能科学家汤晓鸥于12月15日因病救治无效不幸离世,终年55岁。沉痛悼念!2023年12月15日23时45分,商汤科技创始人汤晓鸥教授因病救治无效不幸离世,终年55岁。中国AI界痛失英才,损失无法估量!汤晓鸥教授,R.I.P.。
Mobile-Agent: 具有视觉感知 可以像人类样操作手机的自主多模态AI代理
Mobile-Agent是一款具有视觉感知的自主多模式移动设备代理,由北京交通大学联合阿里巴巴团队共同开发。该代理采用纯视觉解决方案,独立于XML和系统元数据,不需要任何系统代码,完全通过分析图像来理解和操作手机。它能够自动完成各种任务,比如可以在淘宝加购物车车,在APP播放音乐,自主使用导航APP,收发邮件等等。