GPT-4作弊被抓,吉娃娃or松饼打乱顺序就出错,LeCun:警惕在训练集上测试
GPT-4解决网络名梗“吉娃娃or蓝莓松饼”,一度惊艳无数人。现在它被指出“作弊”了!全用原题中出现的图,只是打乱顺序和排列方式。比如GPT-4V能正确数出七个小矮人白雪公主,却把七个葫芦娃数成了10个。