北大视频大模型新SOTA,搞笑抖音视频AI秒懂笑点|开源
AI能理解搞笑视频笑点在哪里了。北大等团队开源视觉语言大模型Video-LLaVA,将图像和视频表示对齐到统一的视觉特征空间,在13个图片和视频基准上达到先进的性能。在视频理解方面,联合训练的也得到了明显的提升。
抖音短视频躺着做!这款视频翻译字幕配音软件不要错过
平时有在做短视频副业项目的小伙伴,肯定遇到过想要搬运剪辑国外视频,但却卡在字幕翻译的问题上。有一款工具可以解决这个问题,为用户提供简单易用的视频翻译和配音功能。支持多种翻译引擎:集成了多种翻译引擎,包括Google、ChatGPT、DeepL、Baidu、DeepLX、Gemini、Tencent等,确保用户能够选择适用于其项目的最佳翻译引擎。