国内首个音视频多媒体大模型万兴“天幕”发布:支持AI剪辑
万兴科技发布了国内首个音视频多媒体大模型万兴天幕”,并宣布大模型研发中心将正式落户马栏山。天幕”聚焦数字创意垂类创作场景,以音视频生成式AI技术为基础,支持全球不同语言,引领音视频创作闭环解决方案,相关能力已在海外规模化商用。万兴科技在互动平台表示,公司目前未使用境外云服务进行大模型的训练,公司天幕大模型的训练是在国内算力和服务器基础上进行。
新加坡国立大学开源多模态语言模型 NExT-GPT,助力多媒体 AI 应用发展
新加坡国立大学NExT研究中心发布了开源多模态大语言模型NExT-GPT,为处理文本、图像、视频和音频等多样化输入提供了强大支持,推动了多媒体人工智能应用的进一步发展。NExT-GPT提供了一个基于聊天的界面,允许用户输入文本、图像、视频或音频文件。该模型在内容生成、多媒体分析以及能够理解并响应用户首选格式的虚拟助手等各个领域都具有潜在的应用前景。
媒体实测特斯拉Cybertruck自动换挡:摄像头帮你自动前进、倒车
特斯拉目前新车型全部采用屏幕换挡的方式,不过因为不够直观、便捷,被不少车主吐槽。但特斯拉采用屏幕换挡的方式,实际上是为其自动换挡技术做铺垫近日,懂车帝就对特斯拉Cybertruck的自动换挡进行了实测。你觉得自动换挡有用吗?
PosterGPT官网体验入口 AI社交媒体内容生成工具自动发布平台
PosterGPT是一个基于AI的社交媒体内容自动生成和发布平台。它可以利用GPT等先进技术,自动从新闻及提要源抓取内容,生成适合社交媒体发布的帖子,支持自动发布到Twitter、Facebook等平台。PosterGPT让社交媒体内容的创作更轻松,点击上方链接,立即提升你的社交媒体影响力!
自媒体必备字幕生成工具Videosrt 可批量快速自动生成视频/音频字幕
VideoSrt是一款基于Golang语言,使用lxn/walkWindows-GUI工具包开发的开源软件工具。其主要功能是识别视频语音并自动生成字幕SRT文件。通过不断更新和发布,扩展了支持的功能和接口,使其始终保持高效性和灵活性。