AI视野:通义千问发布Qwen1.5;背景分割开源模型RMBG v1.4来了;OpenAI 为 DALL-E3添加新水印;苹果图片项目MGIE上线试玩
欢迎来到【AI视野】栏目!这里是你每天探索人工智能世界的指南,每天我们为你呈现AI领域的热点内容,聚焦开发者,助你洞悉技术趋势、了解创新AI产品应用。
训练效率提升40倍!开源图片生3D模型,Stable Zero123来啦
12月14日,著名生成式AI开源平台Stability.ai在官网开源了,图片生成高质量3D模型——StableZero123。StableZero123是基于今年3月,丰田研究院和哥伦比亚大学联合开源的Zero123模型开发成。StableZero123模型主要用于研究,未来会开放商用。
新图像合成模型LCM SD生成图片推导步骤减少至4步!
图像合成是计算机视觉领域的一个重要研究方向,目标是根据给定的条件生成逼真的图像。潜在扩散模型在这方面取得了显著的成果,能够生成高分辨率和高质量的图像。本文也为进一步探索潜在空间中的一致性和结构提供了一个有益的尝试。
GPT-4V被曝离谱bug:突然执行神秘代码,空白图片读出打折信息,网友们都看呆了
GPT-4V出现惊天bug?!原本只是让它分析一张图片,结果它直接犯了致命安全问题,把聊天记录都给抖落出来了。只见它完全没回答图片内容是直接开始执行“神秘”代码,然后用户的ChatGPT聊天记录就被暴露了。也有人提出是不是在一个大模型内部,可以类似操作:Simon觉得这是期待的解决方向,但还没看到有人能真正实现,应该很难,对于当前的LLM结构来说甚至不可能。