谷歌DeepMind发布18秒动画 向用户解释大语言模型的工作原理
谷歌DeepMind发布了一段小视频,试图用动画来解释大语言模型的工作原理。这个视频的发布激发了网友们的激烈讨论。对于这种可视化的运用,也有网友提出了类比,将其与Pytorch中的矩阵乘法做了对比。