谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA
【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。尽管对比基线已经在K400上取得了有竞争力的结果,但所提出的全局蒸馏和token洗牌进一步提高了准确性。
B站全年AIGC相关视频播放量90亿
哔哩哔哩公布了“五大科学焦点榜单”,主要涉及站内有关“AIGC、室温超导、脑机接口、黑洞、可控核聚变”等关键词的视频数据情况。哔哩哔哩表示,在科学和知识品类方面,相关视频占哔哩哔哩用户搜索排名第2位,相关内容播放量占站内41%,00后正在成为科学内容消费主力,其中全年“AIGC”相关视频播放量90亿,播放时长达140亿分钟。获得测试资格的用户将在视频播放页面的右下角显示“AI视频总结”测试版按钮,点击即可生成视频总结,用户可以通过总结点击跳转到视频的相关定位。