MIT最新研究:纯文本模型也能训练出视觉表征 用代码就能作画
MIT计算机科学与人工智能实验室的研究人员进行了一项有趣的研究,通过评估语言模型的视觉能力,揭示了纯文本模型训练视觉概念表征的新可能性。他们使用代码非图像进行渲染和表示,成功地教会语言模型生成和理解复杂的视觉概念。这为未来发展更强大的纯文本模型提供了启示,有望推动语言模型在视觉领域的更广泛应用。