新NeRF技术:将视频转化为可控制的3D模型 创建数字人更简单了
FraunhoferHeinrichHertz研究团队取得重大突破,他们引入了一项全新技术,使用神经辐射场将标准RGB视频转化为可控制的3D人体模型。这一创新代表了计算机图形领域中的一项重要进展,解决了从视频片段中创建逼真、可控制的3D模型一直以来的难题。这项工作将数字人物的创建变得更加可行,为个人创作者和小型制作团队带来更多应用可能性。
腾讯视频运动控制器MotionCtrl正式开源
腾讯日前发布的视频运动控制器MotionCtrl已经正式开源了,并且试用效果非常出色。该项目可以高度自定义相机镜头和画面物体在3D空间运动轨迹,实现更精细和多样化的运动控制。该技术的运动条件由摄像机的姿势和轨迹确定,与视频中物体的外观或形状影响最小。
研究人员推视频运动控制器MotionCtrl 可有效独立控制摄像机和物体的运动
视频生成领域取得了显著进展,但对于视频中的摄像机和物体运动的准确控制仍然是一个挑战。传统方法往往集中在其中一种运动类型,或者在两者之间没有明确的区分,从限制了运动控制的多样性。实验结果表明,MotionCtrl相对于现有方法在运动控制方面表现出色,具有更高的生成视频质量和更灵活的运动控制能力。
耗时5年开发!索尼PS5无障碍控制器正式开售
近日,索尼互动耗时5年开发的PS5无障碍Access控制器,在全球市场同步上市,中国大陆零售价689元。Access控制器与普通PS5手柄相比,最特殊的地方在于,其是为肢体不健全玩家所准备的无障碍控制器,即使玩家双手不能自由活动,也能使用单手、脚或脸等操作。不过目前Access控制器适配的硬件只有PS5,PS4及PC均无法使用。
残障人士也能痛快打游戏了!索尼PS5 Access控制器12月6日上市
索尼官方今天宣布,PS5Access控制器将于12月6日上市,售价689元,目前已经开启预售。这是一款专门针对残障人士打造的手柄,可以让他们可以无障碍使用,畅玩3A大作也没问题。值得一提的是,全新的索尼PS5轻薄版国行也将于12月1日在中国大陆市场开售,数字版售价2999元、配备超高清蓝光光驱的光驱版售价3599元,有需求的用户可以关注一下。
港大与浙大联合研发SC-GS模型 鼠标拖拽实时可编辑3D重建
在数字资产创造和3D重建领域,香港大学CVMI实验室与3D大模型公司VAST以及浙江大学的联合研究团队提出了一项突破性成果——SC-GS模型。这一模型不仅在新视角合成领域掀起了革命性浪潮,更在动态场景的实时交互编辑方面展现了巨大潜力。他们期待在2024年看到更多基于高斯溅射技术的创新工作和探索。
百度地图V20 3D领先版预告:特斯拉全球首发、华为系也将用上
在今日举办的百度Apollo智能汽车产品发布会上,百度副总裁尚国斌表示,百度地图V20将在近期全面上线,支持车机端3D车道级导航。非常重磅的是,特斯拉在华的车型将首发搭载该地图,从5月开始,这一更新将陆续推送给新老特斯拉车主。值得一提的是,百度地图V203D领先版、旗舰版、SR智驾版,不仅支持iOS和安卓支持Linux、QX、鸿蒙等系统。
特斯拉将首发搭载百度地图V20 3D领先版 预计5月陆续推送
百度地图V20即将全面上线,并特别支持车机端的3D车道级导航功能。这一功能的推出,将为用户提供更加精准、直观的导航体验。随着百度地图V20的全面上线,我们期待看到更多车企和科技企业加入到这一领域,共同推动智能出行技术的发展。
InstantMesh:只需10秒就能从图片转3D模型
InstantMesh是一项突破性的技术,能够从单张图像快速生成高质量的三维网格模型。这项技术利用了前馈框架,结合了多视图扩散模型和基于大规模重建模型的稀疏视图重建技术,极大地优化了3D资产的创建过程。InstantMesh的出现,预示着3D建模和可视化领域将迎来新的变革,它将极大地提高工作效率,降低技术门槛,使得更多的人能够参与到3D内容的创作中来。
Spline发布3D生成工具AI 3D Generation 支持文/图生3D模型及混合编辑3D模型
Spline的最新3D生成工具的发布,标志着3D设计领域的一次重大进步。这款在线3D编辑工具不仅支持从文字和图片生成3D模型能够混合和编辑3D模型,为用户提供了一个全面强大的3D设计解决方案。这意味着用户可以始终接触到行业的最新趋势,并将这些新功能应用到自己的项目中,保持创作的前沿性和创新性。
在线3D视频编辑工具使用地址 Lumiere官网地址
Lumiere3DAI是一个强大的在线视频编辑工具,专注于提供优化的3D产品视频,适用于reels、shorts和TikTok等平台。通过定制音乐、摄影角度和场景,您可以轻松展现您产品的优势。Lumiere3DAI的出现,为用户提供了一个便捷强大的工具,帮助他们打造引人注目的3D产品视频,从在竞争激烈的市场中脱颖出。
Meta 推出 ViewDiff 模型:文本生成多视角 3D 图像
Meta与德国慕尼黑工业大学研发出创新模型ViewDiff,旨在帮助用户通过文本、图像或二者结合使用,快速生成高质量多视角3D图像。该模型解决了传统文本生成多视角3D图像领域的三大难点:无法生成真实背景环境、图像质量和多样性不理想、缺乏多视角和一致性。该模型的推出不仅在技术层面上具有重大意义,也将为未来的3D图像生成领域带来更多创新可能。
DiffHuman官网体验入口 3D人体建模软件使用方法教程指南
DiffHuman是一种概率性的光度逼真的3D人体重建方法。它可以从单张RGB图像预测一个3D人体重建的概率分布,并通过迭代降噪采样多个细节丰富、色彩鲜明的3D人体模型。要获取更多详细信息并开始使用DiffHuman,请访问DiffHuman官方网站。
Lixel CyberColor:自动生成无限大的电影级效果的3D场景
LixelCyberColor,由XGRIDS公司研发的这款先进技术产品,正在为3D场景的创建带来革命性的变化。LCC能够自动生成具有电影级效果的无限大3D场景,这一成就得益于它采用的Multi-SLAM和高斯溅射技术。随着XGRIDS技术的不断进步,我们有理由相信,未来的虚拟世界将变得更加真实,更加引人入胜。
三星谋划3D堆叠内存:10nm以下一路奔向2032年
3D晶体管正在各种类型芯片中铺开,3DDRAM内存也讨论了很多年,但一直没有落地。如今三星公开的路线图上,终于出现了3DDRAM。大约2030-2031年的时候,三星将升级到堆叠DRAM,将多组VCT堆在一起,从获得更大容量、更高性能,看起来还会引入电容器作为辅助。
Make-It-Vivid:通过文字描述生成3D卡通动画角色
在创造生动的3D动画角色时,面临着这样的挑战,除了要满足特定领域的高要求比如角色需要有独特风格和丰富细节缺乏高质量的数据支撑。现有方法通常无法生成具有丰富细节,和过度自然的纹理,使得角色看起来不真实,不够生动。该项目的代码即将发布,项目入口:https://make-it-vivid.github.io/。
GRM:只需少量图片,就能在0.1秒内创建3D模型
一款名为GRM的大型高斯重建模型引起了广泛关注。GRM是一种用于3D重建和生成的技术,通过有效整合多视角信息,它能够在极短的时间内重建出精确的3D模型。随着技术的不断发展,我们有理由相信,GRM将为3D建模技术的应用带来更多可能性。
Garment3DGen:用衣服图片就能生成逼纹理效果的3D模型
研究人员提出了一种名为Garment3DGen的方法,旨在实现3D服装的风格化和纹理生成。该方法通过结合先进的计算机视觉技术和人工智能算法,为用户提供了一个简单高效的工具,用于实现服装设计的个性化风格化。随着这一技术的不断完善和推广,我们有理由相信,未来的服装设计将更加多样化和个性化。
Champ:基于3D的人物图片转视频动画
在数字媒体和娱乐行业,如何将静态的人物图片转化为动态的视频一直是一个挑战。一项名为Champ的新技术,让这个任务变得简单高效。无论在任何场景下,只要有合适的输入,Champ都能生成逼真的人类动画。
谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
谷歌DeepMind的研究人员推出了一种面向3D环境的通用AI代理——SIMA。SIMA无需访问游戏的源代码,也不需要定制的API。研究人员表示,未来,会持续迭代SIMA的通用代理能力,希望可以在实际生活中帮助用户做更多的事情。