ICLR 2023 | TranSpeech:高质量非自回归语音到语音翻译
2023年4月4日 - 网易
而语音可以分解为内容信息和声学信息(语者、旋律、音调和能量)两大部分:语言内容表示语音信号的含义,要将语音样本翻译成另一种语言,从语音信号中学习语言信息至关重要;在声学条件中,说话人身份被认为是说话人的声音特征,节奏表征了说话者发出每个音节的速度,音高是语调的一个重要组成部分,能量则影响说话的音量。二...
详情
而语音可以分解为内容信息和声学信息(语者、旋律、音调和能量)两大部分:语言内容表示语音信号的含义,要将语音样本翻译成另一种语言,从语音信号中学习语言信息至关重要;在声学条件中,说话人身份被认为是说话人的声音特征,节奏表征了说话者发出每个音节的速度,音高是语调的一个重要组成部分,能量则影响说话的音量。二...