南洋理工大学研发DIRFA:仅需音频和照片,就能创造逼真数字人
在这项最新的研究中,新加坡南洋理工大学的研究团队成功开发了一项名为DIverseyetRealisticFacialAnimations的计算机程序,该程序通过仅使用音频和一个人的照片,就能够生成逼真的视频,展示说话者的面部表情和头部动作。DIRFA是一种基于人工智能的程序,通过训练模型使用超过一百万个音频视觉剪辑,从能够预测语音中的线索,并将其与面部表情和头部动作关联,从生成与口头音频同步的3D视频。这项研究为多媒体交流领域带来了深远革命性的影响,通过结合人工智能和机器学习等技术,实现了高度逼真的个体说话视频的创作。