让大模型忘记哈利波特,微软新研究上演Llama 2记忆消除术,真·用魔法打败魔法(doge)
最近微软一项研究让Llama2选择性失忆了,把哈利波特忘得一干二净。现在问模型“哈利波特是谁?”,它的回答是这样婶儿的:木有赫敏、罗恩,木有霍格沃茨……要知道此前Llama2的记忆深度还是很给力的,比如给它一个看似非常普通的提示“那年秋天,哈利波特回到学校”,它就能继续讲述J.K.罗琳笔下的魔法世界。此研究只测试了虚构类文本,模型表现的普适性还需进一步验�