热搜话题榜单

3分钟前更新

1 月之暗面Kimi智能助手升级：联网回复更快搜索支持引用溯源 11127人在看 2 华为 Pura 70 Ultra / Pro 今日先锋开售 Pro+/标准版 4 月 22 日开售 12244人在看 3 昆仑万维「天工3.0」与「天工SkyMusic」音乐大模型开启公测 13220人在看 4 百度发布智能计算操作系统万源支持77款大模型 14232人在看 5 百度推出AgentBuilder、AppBuilder、ModelBuilder三大开发工具 15381人在看
6 百度正式发布文心大模型4.0工具版 16768人在看 7 华为官宣P系列品牌升级为Pura：创造独特和现代美学设计 171228人在看 8 360智脑7B参数大模型正式开源最长支持约50万字输入 18233人在看 9 美图Wink“AI动漫”功能升级可将短剧作品转化为动漫风格 19200人在看 10 腾讯智影推出“动态漫画”功能输入文案即可生成AI漫画视频 110447人在看

共找到与“站长”相关的结果1条

提前对齐，视频问答新SOTA！北大全新Video-LLaVA视觉语言大模型，秒懂视频笑点

最近，来自北京大学等机构研究者提出了一种全新视觉语言大模型——Video-LLaVA，使得LLM能够同时接收图片和视频为输入。Video-LlaVA在下游任务中取得了卓越的性能，并在图片、视频的13个基准上达到先进的性能。这些结果证明了联合图片和视频一起训练能够促进LLM理解视觉表示。

Video-LLaVA SOTA

加载更多

©CopyRight CHINAZ.COM - 闽ICP备08105208号