米哈游赞助LGD战队获《DOTA2》TI12季军:《星穹铁道》奖励出炉
《DOTA2》TI12今日结束,由米哈游旗下游戏《崩坏:星穹铁道》赞助的LGD战队获得了季军、AR战队获得四强。《崩坏:星穹铁道》官方今日宣布,将根据jiayouaLGDAR”活动规则,为《崩坏:星穹铁道》玩家发放600星琼。在昨日进行的淘汰赛败者组半决赛中,另一支中国战队AR同样不敌GG,以0-2的比分获得第四名。
重回2021年!《DOTA2》TI12 LGD不Ban猛犸引热议
今日,《DOTA2》TI12迎来淘汰赛胜者组决赛,由LGD对战Spirit。在第一局比赛中,Spirit战胜LGD,前期LGD在对线期给Yatoro造成巨大威胁,但Spirit通过中期完美的运营反超经济。在《DOTA2》里马格纳斯的官方定义其实是半人犀牛”,但在《DOTA》时代是叫半人猛犸,所以这个称呼也被玩家们一直沿用了下来。
AI视频理解天花板,全新MiniGPT4-Video刷爆SOTA!宝格丽宣传片配文一绝
【新智元导读】秒懂视频的AI诞生了!KAUST和哈佛大学研究团队提出MiniGPT4-Video框架,不仅能理解复杂视频,甚至还能作诗配文。OpenAI官方账号发布了第一支由Sora制作的MV——Worldweight,引全网围观。下一步研究将模型能力扩展到处理更长视频的能力。
Champ首发开源:人体视频生成新SOTA,5天斩获1k星,demo可玩
由阿里、复旦大学、南京大学联合发布的可控人体视频生成工作Champ火爆全网。该模型仅开源5天GitHub即收获1k星,在Twitter更是「火出圈」,吸引了大量博主二创,浏览量总量达到300K。更多技术细节以及实验结果请参阅Champ原论文与代码,也可在HuggingFace或下载官方源码动手体验。
谷歌AI视频再出王炸!全能通用视觉编码器VideoPrism,性能刷新30项SOTA
【新智元导读】谷歌团队推出「通用视觉编码器」VideoPrism,在3600万高质量视频字幕对和5.82亿个视频剪辑的数据集上完成了训练,性能刷新30项SOTA。AI视频模型Sora爆火之后,Meta、谷歌等大厂纷纷下场做研究,追赶OpenAI的步伐。尽管对比基线已经在K400上取得了有竞争力的结果,但所提出的全局蒸馏和token洗牌进一步提高了准确性。
一句话精准视频片段定位!清华新方法拿下SOTA|已开源
只需一句话描述,就能在一大段视频中定位到对应片段!比如描述“一个人一边下楼梯一边喝水”,通过视频画面和脚步声的匹配,新方法一下子就能揪出对应起止时间戳:就连“大笑”这种语义难理解型的,也能准确定位:方法名为自适应双分支促进网络,由清华大学研究团队提出。ADPN是用来完成一个叫做视频片段定位的视觉-语言跨模态任务,也就是根据查询文本从视频中定位
提前对齐,视频问答新SOTA!北大全新Video-LLaVA视觉语言大模型,秒懂视频笑点
最近,来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA,使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能,并在图片、视频的13个基准上达到先进的性能。这些结果证明了联合图片和视频一起训练能够促进LLM理解视觉表示。
北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源
AI能理解搞笑视频笑点在哪里了。北大等团队开源视觉语言大模型Video-LLaVA,将图像和视频表示对齐到统一的视觉特征空间,在13个图片和视频基准上达到先进的性能。在视频理解方面,联合训练的也得到了明显的提升。