国内首个音视频多媒体大模型万兴“天幕”发布:支持AI剪辑
万兴科技发布了国内首个音视频多媒体大模型万兴天幕”,并宣布大模型研发中心将正式落户马栏山。天幕”聚焦数字创意垂类创作场景,以音视频生成式AI技术为基础,支持全球不同语言,引领音视频创作闭环解决方案,相关能力已在海外规模化商用。万兴科技在互动平台表示,公司目前未使用境外云服务进行大模型的训练,公司天幕大模型的训练是在国内算力和服务器基础上进行。
新加坡国立大学开源多模态语言模型 NExT-GPT,助力多媒体 AI 应用发展
新加坡国立大学NExT研究中心发布了开源多模态大语言模型NExT-GPT,为处理文本、图像、视频和音频等多样化输入提供了强大支持,推动了多媒体人工智能应用的进一步发展。NExT-GPT提供了一个基于聊天的界面,允许用户输入文本、图像、视频或音频文件。该模型在内容生成、多媒体分析以及能够理解并响应用户首选格式的虚拟助手等各个领域都具有潜在的应用前景。