BASE TTS官网体验入口 亚马逊AI自然语言处理语音合成免费下载使用地址
BASE TTS 是亚马逊开发的一款大规模文本到语音合成模型。该模型利用了 10 亿参数的自动回归转换器,能够将文本转换成语音代码,并通过卷积解码器生成语音波形。通过使用超过 10 万小时的公共语音数据进行训练,BASE TTS实现了语音自然度的新状态,同时还采用了音素解离和压缩等新颖的语音编码技术。随着模型规模的增大,BASE TTS展现出了处理复杂句子的自然语调能力。点�