谷歌推出通用AI代理:能自动执行600多种动作,游玩复杂3D游戏
谷歌DeepMind的研究人员推出了一种面向3D环境的通用AI代理——SIMA。SIMA无需访问游戏的源代码,也不需要定制的API。研究人员表示,未来,会持续迭代SIMA的通用代理能力,希望可以在实际生活中帮助用户做更多的事情。
谷歌推出通用AI代理SIMA:3D游戏世界的全能AI玩家
正文:近日,谷歌DeepMind的研究团队宣布推出一款面向3D虚拟环境的通用AI代理——SIMA。这一创新成果标志着AI技术在游戏领域的应用迈出了重要一步。谷歌DeepMind的研究人员表示,他们将继续迭代和提升SIMA的通用代理能力,期望未来SIMA能在现实生活中为用户提供更多帮助。
腾讯发布自研游戏AI引擎:3D城市布局效率提升百倍,UGC工具已上线《元梦之星》
现在连引擎都有AI味儿了——就在游戏开发者大会上,腾讯刚刚发布自研游戏AI引擎GiiNEX。基于生成式AI和决策AI技术,GiiNEX可以支持游戏从研发到运营的全生命周期需求。围棋AI“绝艺”、会打王者荣耀的“绝悟”都来自于该团队。
又整活儿?谷歌推Agents SIMA 可让角色在任何3D游戏场景中蹦跶
谷歌推出了一款名为AgentsSIMA的新型AI系统,专门设计用于在任何3D游戏中自主行动。这种系统能够根据自然语言指令在多种视频游戏设置中执行任务,标志着AI代理展示了在广泛游戏世界中理解指令并执行任务的能力,类似于人类的操作方式。随着在更多环境中的训练以及模型性能的提升,SIMA有望成长为一个更加全能和智能的AI助手,服务于现实世界中的各种任务。
3D AIGC领域的Midjourney?Meshy可一句话生成3D游戏资产
随着游戏、电影和XR行业对3D模型需求的不断增加,Meshy作为一款由胡渊鸣创立的在线生成AI工具,迎合了市场对3D内容快速生成的需求。Meshy的创始人兼CEO胡渊鸣是计算机图形学知名学者,Meshy是他创立的独立新品牌。对于对3D内容设计感兴趣的用户,Meshy提供了加入Discord和注册WebApp的方式,分别能享受无限的免费生成机会和每天20个免费生成机会。
报告:Real Car Driving: Race City 3D位列10月游戏下载榜榜首
SensorTower商店情报数据显示,BotanicaGlobal《RealCarDriving:RaceCity3D》以超过1900万次下载,位列10月全球移动游戏下载榜榜首。印度是该游戏第一大市场,贡献了26.4%的下载量;其次是巴西和墨西哥市场,分别占12%和7%。巴西市场以8.6%的下载量排名第2,第3名是美国市场,占7.8%。
在线3D视频编辑工具使用地址 Lumiere官网地址
Lumiere3DAI是一个强大的在线视频编辑工具,专注于提供优化的3D产品视频,适用于reels、shorts和TikTok等平台。通过定制音乐、摄影角度和场景,您可以轻松展现您产品的优势。Lumiere3DAI的出现,为用户提供了一个便捷强大的工具,帮助他们打造引人注目的3D产品视频,从在竞争激烈的市场中脱颖出。
Champ:基于3D的人物图片转视频动画
在数字媒体和娱乐行业,如何将静态的人物图片转化为动态的视频一直是一个挑战。一项名为Champ的新技术,让这个任务变得简单高效。无论在任何场景下,只要有合适的输入,Champ都能生成逼真的人类动画。
Stable Video 3D震撼登场:单图生成无死角3D视频、模型权重开放
3D生成领域迎来新的「SOTA级选手」,支持商用和非商用。StabilityAI的大模型家族来了一位新成员。更多技术细节和实验结果请参阅原论文。
Stability AI推Stable Video3D(SV3D)传图可生成3D视频
StabilityAI推出了StableVideo3D,这是一款用于生成3D视频的新型genAI工具。SV3D是在稳定AI之前的StableVideo技术基础上开发的,该技术使用户能够从图像或文本提示中生成短视频。SV3D_p则扩展了这一功能,既可以使用单个图像,也可以使用轨道视图,允许用户沿指定的摄像机路径创建3D视频。
OpenAI或用3D引擎/虚幻引擎训练视频模型Sora
OpenAI最近发布了多段由Sora生成的视频,展示了令人惊叹的3D效果。这些视频内容丰富,包括潜水探索沉船、描述日本江户时代宁静场景的立体模型等。这些视频不仅在视觉上令人惊叹,同时也引发了人们对人工智能技术在创作和娱乐领域的无限想象。
周鸿祎称Sora生成视频堪比CG:未做3D建模 只需文字就可逼真描绘
今日,周鸿祎再次谈到Sora视频模型,他表示Sora生成视频堪比CG。周鸿祎发视频称,Sora有三个片段让他觉得非常惊讶。周鸿祎表示,Sora是记录文生视频AIGC的工具,它反映了AI对世界的理解,是从文字进入图像,再从图像展示对这个世界3D模型的理解。
AI视野:OpenAI公布Sora技术报告;Meta首发AI视频模型V-JEPA;ComfyUI发布最新3D Pack;Nomic AI 发布首个完全开源的长文本嵌入模型
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
谁能想到,一款3D建模AI工具成了Ins网红的视频创作利器
近期话题热度拉满的《幻兽帕鲁》AI抄袭瓜,想必各位一线冲浪玩家已经略有耳闻了。背后最大的争议之一在于,无经验的小团队快速开发出3D游戏大作,遥遥领先以往同类项目的生产力。
阿里MotionShop怎么用?MotionShop视频转3D详细使用教程
阿里又推新项目——MotionShop,通过它可以将视频中的角色替换为3D化身。很多用户可能没概念,这个我们日常中用得到?普通人能怎么玩?实际上,对于玩抖音、快手等平台的用户来说,MotionShop的最终玩法和通义千问的全民舞王有点像,就是你可以利用这个工具来制作好玩的视频。然后等待视频生成即可~这个过程预计需要等待十分钟。
阿里推新项目MotionShop 可将视频中的角色替换为3D
阿里巴巴推出了名为MotionShop的新项目,这一项目可以将视频中的角色替换为3D化身。MotionShop利用先进的视频处理和3D渲染技术,能够高效地将视频中的某个角色替换为3D人物,同时不改变视频中的其他场景和人物。第一步:上传一个包含人物的视频;第二步:选择视频中要替换的人物;第三步:选择要替换的虚拟角色模型并点击生成,等待10分钟即可生成结果。
实时渲染3D技术BakedAvatar 可通过简短视频复制出人物3D头部
BakedAvatar是一项实时创建和渲染逼真的动态3D头像的技术。它可以通过简短的视频复制出人物的3D头部模型,并精确捕捉面部特征,模拟表情和头部运动。所有这些功能都能够在不牺牲渲染质量的情况下实时进行,对于需要快速反应和实时更新的应用非常重要。
浙大研究团队推新AI框架Human101:单视角视频构就能重建3D数字人
在虚拟现实领域,快速创建定制虚拟人物并实现与其互动是一个普遍的应用场景。以往的方法在快速重建高保真3D数字人体和实时渲染之间往往难以平衡。Human101通过引入创新的技术和实用的方法,成功地解决了单视角视频中快速建模和实时渲染之间的矛盾,为实时交互应用和沉浸式虚拟现实体验提供了可行的解决方案。
苹果最新AI研究或彻底改变iPhone体验 比如可从视频生成逼真3D头像
总部位于加利福尼亚的科技巨头苹果公司再次在人工智能领域取得重大突破,通过两篇新论文介绍了关于3D头像和高效语言模型推理的新技术。这些创新有望实现更沉浸式的视觉体验,并使复杂的AI系统能够在iPhone和iPad等消费设备上运行。苹果通过这些创新为人工智能的未来打开了新的大门,为用户带来了更加丰富和先进的体验。
创新3D技术Gaussian-SLAM 通过分析视频重建逼真的3D场景
Gaussian-SLAM是一项新兴技术,可以通过分析视频流中的图像来创建逼真的3D模型,从重建现实世界场景。通过观看一个视频,Gaussian-SLAM可以分析视频中的图像,能够理解视频中的环境布局和物体的位置。这项技术的出现为模拟现实世界和创造逼真的虚拟环境提供了新的可能性。