一块显卡理解一部电影,最新超长视频理解大模型出炉!“大海捞针”准确率近95%,代码已开源
仅需1块80G显卡,大模型理解小时级超长视频。智源研究院联合上海交通大学、中国人民大学、北京大学和北京邮电大学等多所高校带来最新成果超长视频理解大模型Video-XL。Video-XL的模型代码均已开源,以促进全球多模态视频理解研究社区的合作和技术共享。