苹果开源图像新技术ml-mgie 可通过指令修改图片
苹果开源了一种新的技术,名为多模态大语言模型引导的编辑,这项技术能够帮助用户通过自然语言指令来修改图片,使得编辑图片更加简单和自然。MGIE采用多模态大型语言模型进行图像编辑指令的生成,通过端到端训练,模型不仅捕捉视觉想象力执行图像处理操作。在实现更加直观和自由的图像编辑过程中,这一方法有望为未来的计算机视觉和图像处理研究提供新的思路。
Poe推出新功能Image Remix 用户可修改和定制AI生成的图片
Poe最近推出了一个名为ImageRemix的新功能,让用户可以随心所欲地修改和定制AI生成的图片。这项功能包括改变图片的风格、布局和颜色等,让用户能够根据自己的喜好创建更个性化的图片。Poe计划很快将支持扩展到iOS和Android设备,让更多用户能够享受到这一创新功能。
GPT-4V被曝离谱bug:突然执行神秘代码,空白图片读出打折信息,网友们都看呆了
GPT-4V出现惊天bug?!原本只是让它分析一张图片,结果它直接犯了致命安全问题,把聊天记录都给抖落出来了。只见它完全没回答图片内容是直接开始执行“神秘”代码,然后用户的ChatGPT聊天记录就被暴露了。也有人提出是不是在一个大模型内部,可以类似操作:Simon觉得这是期待的解决方向,但还没看到有人能真正实现,应该很难,对于当前的LLM结构来说甚至不可能。