谷歌推Scenic:可识别视频内容 并生成详细描述
Scenic是谷歌推出的模型,一个专注于计算机视觉领域的代码库,主要用于研究基于注意力的模型。该库提供了一系列共享的轻量级库,解决训练大规模视觉模型时常见的任务,并包含了几个使用这些库的问题特定训练和评估循环的项目。只有当功能被证明在许多模型和任务中广泛有用时,才可能将其上游到Scenic的共享库中。