清华大学团队推出RTFS-Net:革新视听语音分离,百万参数实现高效性能
清华大学的胡晓林团队最近推出了一项创新性的视听语音分离方法,称为RTFS-Net。这一方法通过采用压缩-重建的策略,不仅实现了百万参数以下的视听语音分离显著减少了计算复杂度,为音视频分离领域带来了新的视角。这一创新性的视听语音分离方法为提高AVSS性能提供了新的思路,不仅降低了计算复杂度和参数数量在保持显著性能提升的同时,为音视频分离领域注入了更多创新和高效的架构。