苹果文字编辑图像项目MGIE上线Demo MGIE试玩地址公布
还记得日前苹果开源的图像新技术MGIE吗?这项技术能够帮助用户通过自然语言指令来修改图片,使得编辑图片更加简单和自然。苹果上线了MGIE项目的Demo,用户可以在线上试玩。不要使用MGIE对人像进行任何形式的修改,这些都不被允许。
CyberDemo官网体验入口 AI机器人技术在线使用地址
CyberDemo是一个旨在通过模拟人类演示来增强现实世界中灵巧操作的项目。它可能涉及到机器人技术、机器学习和模拟环境的结合,以提高机器人在复杂环境中的操作能力。通过模拟人类演示和灵巧操作的结合,CyberDemo为机器人技术领域带来了新的突破。
研究人员推新AI框架CyberDemo:通过视觉观察让机器人模仿学习
加利福尼亚大学圣地亚哥分校和南加利福尼亚大学的研究人员最近推出了一种名为CyberDemo的新型人工智能框架,旨在通过视觉观察进行机器人模仿学习。传统的模仿学习方法通常需要大量高质量的示范数据来教导机器人完成复杂任务,特别是对于需要高度灵巧的任务来说。虽然为每个任务设计模拟环境需要额外的工作,但减少了数据收集的人为干预,并避免了复杂的奖励设计�
Stability AI杀回来了:视频生成新Demo效果惊人,网友:一致性超群
StableDiffusion要王者归来了?StabilityAICEOEmadMostaque最新推文,四段视频引人无数遐想。不少网友怀疑,这是StableVideoDiffusion新版本的演示Demo。又或者在可控性等上面去卷……这不就在前几天,runway的Gen-2再进化——只需5个笔刷,对着一张图一顿刷刷刷刷刷,原本静止的小鸟们就各自运动了起来。
新AI工具DemoFusion:让用户在个人电脑上就能生成高分辨率图像
一项新的技术正在将低成本、高分辨率的人工智能图像生成带给更广泛的用户群体无需强大计算机背后的付费壁垒。要创建高质量的AI图像,用户必须订阅Midjourney或DALLE-3等服务,或购买自己的超级计算机。这并不是一种简单的放大方法是通过在图像中逐块工作,至少提高16倍的细节和分辨率。
微软写了份GPT-4V说明书:166页讲解又全又详细,提示词demo示例一应俱全 | 附下载
多模态王炸大模型GPT-4V,166页“说明书”重磅发布!且还是微软团队出品。什么样的论文,能写出166页?不仅详细测评了GPT-4V在十大任务上的表现,从基础的图像识别、到复杂的逻辑推理都有展示;还传授了一整套多模态大模型提示词使用技巧——手把手教你从0到1学会写提示词,回答专业程度一看就懂,属实是把GPT-4V的使用门槛打到不存在了。她的研究领域是基于多模态感知智能
DeepMind研发新AI项目Open-X Embodiment,可控制各种类型的机器人
GoogleDeepMind与33家其他研究机构合作推出了一个令人瞩目的新项目,旨在解决机器人领域的一个重大挑战:为每个机器人、任务和环境训练机器学习模型所需的巨大工作量。这个项目的目标是创建一个通用型AI系统,能够与不同类型的物理机器人协同工作,并执行多种任务。机器人领域的未来在于使机器人能够相互学习,让研究人员互相学习。
Nvidia的NeMo项目利用生成式AI设计半导体芯片
Nvidia的NeMo项目已经在半导体芯片设计中展示了生成式人工智能的巨大潜力。在一项最新的研究中,Nvidia的半导体工程师们展示了如何利用生成式AI来改进半导体芯片的设计过程。企业有兴趣构建自己的定制LLMs可以利用Nemo框架,该框架可以在GitHub和NvidiaNGC目录上获得。