扎克伯格演示使用 Meta 新 AI 语音翻译技术直接翻译闽南语
据介绍,为开发这个只有语音的全新翻译系统,Meta AI 研究人员必须克服许多来自传统机器翻译系统的挑战,包括数据收集、模型设计以及准确度评估。其中一个重大障碍在于是否能够收集到足够的数据,由于闽南语是所谓的资源匮乏语言,未有足够的训练数据;此外,能将英语翻译成闽南语的翻译人员相对较少,因此更难以收集数据资料并加上注解来训练模型。为此 Meta 利用中文作为中间语言,以建立伪标签和人工翻译,也就是说先将英语(或闽南语)语音翻译成中文文字,接着再翻译成闽南语(或英语),然后新增至训练数据中。