GPT-4V搞不明白勾股定理!最新基准测试错误率竟高达90%
马里兰大学发布了一项重要研究,针对GPT-4V视觉模型进行了首个专为其设计的基准测试,名为HallusionBench。这项研究揭示了令人震惊的发现,即GPT-4V的错误率高达90%。这项研究对于深化我们对大型语言模型的认识,以及推动其在现实世界中的应用具有重要意义。