语言学家重出江湖!从「发音」开始学:这次AI模型要自己教自己
2022年9月13日 - 网易
当这种规则被限制为不能循环应用于自己的输出时,规则和词法学就对应于双向有理函数(2-wayrationalfunctions),又对应于有穷状态转换器(finite-statetransductions)。有人认为有穷状态转换器的空间有足够的表现力来涵盖形态语音学中已知的经验现象,并代表了对语音学理论实际使用的描述能力的限制。为了学习这种语法,...
详情
10小时训练数据打造多语种语音识别新高度
2021年1月12日 - 网易
首先利用Mandarin和Cantonese单语文本数据训练多语言编码器,该编码器具备同时编码Cantonese和Mandarin的能力;然后在该预训练模型基础上,利用Mandarin分词数据训练一个分词系统,最后利用BabelCantonese训练集里文本分词数据对该分词模型进行finetune,得到最终的Cantonese分词模型。该分词模型不仅对e2e的结果进行Babel词典矫正,同时...
详情
四六级倒计时,满满干货送给你!
2020年8月29日 - 新浪新闻
看着音标重新背一遍高中、四、六级单词(单词是基础,一定要多背,避免出现用时方恨少的尴尬情况)注意听力三原则!!!1.关键原则通常情况下,动词、名词为关键信息;形容词、副词为相对次要信息。语法是一种合规性要求,但对整体意思的把握并不关键。2.连读原则如果没有听出连读,接收到的信息将会失去部分准确性。
详情
数据之战:NLP迈向实用阶段的核心所在
2020年3月11日 - 网易
Danny:其实它们是不同的应用类型,ASR就是一个语音识别。通俗说,就是把人说的内容转换成对应的文字。比如微信语音可以直接转换成文字,这就是一个直观的ASR应用。TTS(TexttoSpeech),就是文本到语音,在业界的一个说法就是合成语音,也就是让机器说话。TTS实际上它是反过来的,先给机器提供文本,机器对照着这个文本,...
详情