分解大模型的神经元!Claude团队最新研究火了,网友:打开黑盒
神经网络的不可解释性,一直是AI领域的“老大难”问题。我们似乎取得了一丝进展——ChatGPT最强竞对Claude背后的公司Anthropic,利用字典学习成功将大约500个神经元分解成了约4000个可解释特征。薪资在25万美元-52万美元之间,研究内容跟如上报告息息相关。