谷歌发布基础世界模型Genie:11B参数,单张图生成可交互的虚拟世界
谷歌最新发布了基础世界模型Genie,这一模型拥有110亿参数,能够生成可交互的虚拟世界。Genie的出现让人们看到了人工智能在虚拟世界的无限可能性。Genie的出现将进一步推动虚拟世界的发展,为人类带来更多惊喜和可能性。
迪士尼展示VR滑动地板:实现虚拟世界自由行走
迪士尼推出了一款VR滑动地板HoloTile,可让玩家在虚拟世界自由行走。HoloTile由迪士尼工程师兼发明家LannySmoot打造,被官方称为全球首款多人、全方向、模块化、可扩展的虚拟现实跑步机地板”。HoloTile支持多人同时体验,外观时尚,至于地板内部究竟隐藏着怎样的秘密,是否使用了传感器和摄像头进行动作捕捉,目前暂不得知。
英伟达官方盘点2023年10大研究!「神经朗琪罗」秒变逼真大卫,用AI生成3D虚拟世界
英伟达官方盘点2023年10大研究,从CV到AI,从智能体到生成式AI。英伟达不但现实世界中用GPU收割全世界,也在虚拟世界中用一项项匪夷所思的技术展开了一场革命。在这个框架中,研究人员训练了一组专家降噪器,专门用于在生成过程的不同间隔中进行降噪,从提高合成能力。
港大开发V-IRL平台:将真实世界地图纳入虚拟环境 给AI Agent完整的一生!
港大和NYU的研究团队合作开发了一个名为V-IRL的平台,该平台将真实世界的地图、街景等丰富信息融入到虚拟环境中,为AIAgent提供了更真实和完整的生活体验。这项研究的核心在于构建一个可扩展的平台,利用地理信息和街景图像等API将AI智能体嵌入到真实城市环境中。这项研究也展示了人工智能在未来城市规划、个人助手、生活辅助工具等领域的巨大潜力,为我们进入智能体时代打下了坚实的基础。
多模态语言模型Reka Core:可分析图片、视频、音频 评测得分与GPT-4接近
RekaAI近日宣布推出其最新力作——RekaCore,这是一款前沿的多模态语言模型,拥有强大的性能和灵活的部署方式。该模型像Gemini一样可以直接分析图片、视频、音频,评测得分与GPT-4和Gemini-Ultra接近。通过Edge、Flash和Core等系列模型的全面支持,Reka已经准备好迎接更广泛的挑战,展望未来,我们期待着与更多愿意加入我们的伙伴共同探索多模态世界的无限可能。
无限重生图片样式,999次也没问题!
当我们使用Midjourney、DALL·E3、StableDifusion等模型生成图片后,想在保留主体大框架的情况下改变图片的样式,最直接的方法就是通过PS、AdobeLightroom、DxOPhotoLab等专业修图软件。但这对于很多人来说不太方便,也不符合AI时代的高效率处理方法。有兴趣的小伙伴可以去试试。
马斯克XAI发布Grok-1.5 Vision 多模态模型 可处理文本和图片信息
在人工智能领域,多模态模型的发展一直是行业关注的焦点。马斯克XAI公司发布了其最新的多模态模型——Grok-1.5Vision,这一模型不仅能够处理文本信息能够理解和分析各种视觉数据,如文档、图表、截图和照片,标志着公司在人工智能技术上迈出了重要一步。随着该模型的进一步优化和应用,我们有理由相信,它将在多个领域发挥重要作用,推动人工智能技术向前发展。
facet ai怎么用?AI图片编辑修图工具Facet AI详细使用教程(附产品入口)
产品简介:FacetAI是一款创新的图像编辑工具,以实时图像生成和精确控制图像元素为核心优势,为广告制作和产品图像设计领域带来革命性变化。用户可通过直观的画布操作实现对图像元素的精准控制,提高工作效率。侧边栏第二个按钮还支持对生成的图片进行风格,色调,光线的调整,这里就不一一赘述,大家可以根据自己的喜好来调整。
OpenAI发布GPT-4-Turbo 正式版 可识别图片
OpenAI发布了GPT-4-Turbo正式版,这是一个带有视觉能力的模型,能够处理128k的上下文。这个模型现在已经全面开放,可以通过“gpt-4-turbo”来使用,最新版本为“gpt-4-turbo-2024-04-09”。GPT-4-Turbo是一个功能强大的模型,它的发布将为AI领域带来新的可能。
AI图片编辑工具Facet怎么用?Facet AI详细使用教程(附产品入口)
AI图像编辑软件DesignEdit 像PS一样分图层处理图片
DesignEdit是一款突破性的图像编辑软件,它采用了设计领域中常见的图层概念,为用户带来了一种全新的空间感知图像编辑体验。通过将复杂的图像编辑任务分解为多层潜在的编辑操作,DesignEdit实现了对象移除、多对象编辑、镜头平移和缩放、排版编辑以及跨图像合成等一系列高级编辑功能。这不仅为创意设计提供了无限的可能性,也为图像合成和视觉特效制作带来了新的解决方案。
Nightshade:使AI模型在未经许可的情况下无法训练图片
站长之家(ChinaZ.com)4月9日 消息:据报道,芝加哥大学的研究人员开发了一种名为Nightshade的工具,旨在防止未经许可的AI图像生成。该工具可以使AI图像生成器无法使用未经许可的图像进行训练,从而保护了艺术家和版权所有者的作品。Nightshade的工作原理是在图像中添加隐藏信息,这些信息对人眼不可见。当像Stable Diffusion这样的AI图像生成器尝试使用这些图像进行训练时,这些
苹果斥资5000万美元授权数百万张Shutterstock图片用于训练AI模型
苹果近日宣布与Shutterstock达成协议,授权使用数百万张图片来训练其人工智能模型。除了苹果之外,谷歌、Meta和亚马逊等科技公司也曾与Shutterstock达成类似协议,用于发展视觉AI引擎。其打算开发能够尽可能使用设备上技术的LLMs。
GRM:只需少量图片,就能在0.1秒内创建3D模型
一款名为GRM的大型高斯重建模型引起了广泛关注。GRM是一种用于3D重建和生成的技术,通过有效整合多视角信息,它能够在极短的时间内重建出精确的3D模型。随着技术的不断发展,我们有理由相信,GRM将为3D建模技术的应用带来更多可能性。
Living Images | Coframe官网体验入口 网站图片优化A/B测试使用地址
LivingImages|Coframe是一项由Coframe提供的服务,旨在通过生成性A/B测试来优化网站图片。这项技术可以帮助提升用户体验和网站性能,通过不断的测试和优化,找到最适合目标受众的图片版本。如欲了解更多详情,请访问LivingImages|Coframe官网。
Adobe Firefly推出结构参考(Structure Reference)功能:可保持图片结构改变画风
Adobe旗下AI图像生成器Firefly推出了“结构参考"重大新功能,让用户在生成图像时拥有更多控制力。这项功能类似于ControlNet里的canny模式,可以保持图片结构不变,改变画风。AdobeFirefly的不断创新和推广,将为用户带来更便捷、更安全、更高效的图像生成体验。
Garment3DGen:用衣服图片就能生成逼纹理效果的3D模型
研究人员提出了一种名为Garment3DGen的方法,旨在实现3D服装的风格化和纹理生成。该方法通过结合先进的计算机视觉技术和人工智能算法,为用户提供了一个简单高效的工具,用于实现服装设计的个性化风格化。随着这一技术的不断完善和推广,我们有理由相信,未来的服装设计将更加多样化和个性化。
创新的文本编码器TextCraftor 通过奖励函数优化改善图片质量
在人工智能领域,一项名为TextCraftor的新技术引起了广泛关注。这是一种端到端的文本编码器微调技术,旨在解决现有模型在生成与文本提示高度对齐的图像方面的挑战。TextCraftor的控制生成能力也为个性化内容创作提供了新的可能性。
DALL-E将推图片编辑功能 生成图像可局部重绘
DALL-E即将推出图片的编辑功能,类似于局部重绘。这意味着用户可以通过画笔涂抹指定区域,然后对该区域进行重绘。这一功能不仅可以帮助用户修正图像中的错误可以添加新元素或改变图像的风格。
Champ:基于3D的人物图片转视频动画
在数字媒体和娱乐行业,如何将静态的人物图片转化为动态的视频一直是一个挑战。一项名为Champ的新技术,让这个任务变得简单高效。无论在任何场景下,只要有合适的输入,Champ都能生成逼真的人类动画。