腾讯混元发布并开源图生视频模型:让照片开口说话唱歌AI神器
今日,腾讯混元宣布发布图生视频模型并对外开源,同时上线对口型与动作驱动等玩法,并支持生成背景音效及2K高质量视频。企业和开发者可在腾讯云申请使用API接口,用户通过混元AI视频官网即可体验。腾讯混元表示,此次开源的图生视频模型,是混元文生视频模型开源工作的延续,模型总参数量保持130亿,模型适用于多种类型的角色和场景,包括写实视频制作、动漫角色甚至CGI角色制作的生成。