GPT-4充当“规划师、审计师”,颠覆性双层文生图表模型
DALL-E3、Midjourney、StableDiffusion等模型展现出了强大的创造能力,通过文本便能生成素描、朋克、3D、二次元等多种类型的高质量图片,但在生成科学图表方面却略显不足。这是因为模型在生成图表时会遗漏重要的对象,生成错误的对象关系箭头,以及产生不可读的文本标签,缺乏对对象的精细布局控制。还进行了人类评估,多数人表示,更喜欢DiagrammerGPT生成的图表。