EMO同款?微软发布对口型软件VASA-1 图片加语音即可生成逼真说话视频
由微软亚洲研究院开发的VASA-1项目,是一项前沿的人工智能技术,它能够将单一静态图像和一段语音音频转换为逼真的对话面部动画。这项技术不仅能够实现音频与唇部动作的精确同步能够捕捉并再现丰富的面部表情和自然的头部动作,极大地增强了生成视频的真实感和生动性。所有在演示中使用的肖像图像,除了蒙娜丽莎外,都是由StyleGAN2或DALL-E-3生成的虚拟、不存在的身份
阿里推声画同步框架EMO 1张图片加音频即可生成对口型视频
阿里巴巴智能计算研究所提出了一种新的生成式框架EMO,只需输入图片和音频即可生成具有表现力的视频视频中的嘴型还可以与声音匹配。这项技术支持多语言、对话、唱歌以及快速语速的适配,但也可能成为造假的利器,因此一些名人可能需要警惕了。需要注意的是,该框架目前仅用于学术研究和效果演示有待进一步优化和扩展其应用范围。
吴京代言舞中国龙!中兴龙年龘片《完事兴龙》1月22日首映
农历龙年春节马上就要到了,各大手机厂商也推出了多款龙年周边。中兴手机宣布,中兴x吴京2024年龙年龘片《万事兴龙》将于1月22日首映,预热海报中,身穿中山装的吴京舞起了中国龙,十分帅气。有网友在互动平台上建议,中兴营销部门去找刘畊宏,周杰伦等活跃度比较强的大V流量明星,作为形象代言人。
168元火锅套餐生菜只有1片叶子 门店回应:配菜员疏忽导致
1月14日,亳州一位消费者在团购火锅套餐时遭遇了不满,他发现生菜中只有一片菜叶子,感觉被欺骗了。涉事火锅店的门店经理作出回应。此事也引发了公众对于餐饮业透明度和公平交易的讨论。
阿里推开源版“妙鸭”FaceChain 1张图片百种定制
FaceChain-FACT是阿里推出的一项人工智能生成个性化肖像的技术,通过DeformableNeuralRadianceFields技术从普通视频中创造自由视点的肖像。使用FaceChainAI照片生成模型,不需要提供多张照片训练LoRA,仅需一张用户照片即可生成高度定制的肖像,生成速度更是快过商业应用100倍,达到秒级。这对于人工智能生成内容的发展具有积极的推动作用。
解读1秒生成高精准图片模型——SDXL Turbo
著名开源生成式AI平台Stability.ai发布了,全新文生图模型SDXLTurbo。该模型只需1秒甚至更少的时间就能生成高精准图片,可将通常50个生成步降至1—4步。哎~~万万没想到现实中的高压学习、生活方法也适用于大模型界,看来开发灵感真的无处不在啊,真是名师出高徒,严父出孝子。
游戏界顶流!《GTA6》首部预告片播放量破亿:1天半超越前代12年纪录
昨天一早,RockstarGames正式发布《GTA6》首支预告片。该预告片在R星官方油管频道正式突破1亿播放量,仅1天半的时间就超越了前代《三男一狗》首个预告12年来累计1亿的播放量。GTA系列是游戏史上最有影响力的单机游戏在《三男一狗》发售后,R星推出的GTAonline更吸引了无人玩家加入其中,到今年9月,该游戏总销量已到达4.1亿份。
太快了!文生图片只需1秒,开源SDXL Turbo来啦!
11月29日,著名开源生成式AI平台Stability.ai在官网发布了,开源文生图模型SDXLTurbo。根据使用体验,SDXLTurbo的生成图像效率非常快,可以做到实时响应。但SDXLTurbo对扩散模型的生成效率、质量实现了重大技术突破,可以帮助中小型企业以更低的成本来进行部署使用。