如何从零开始训练BERT模型|张量|dataset|预训练_网易订阅
2021年7月7日 - 网易
OSCAR数据集拥有大量不同的语言——从头开始训练最清晰的用例之一是我们可以将BERT应用于一些不太常用的语言,例如泰卢固语或纳瓦霍语。我的语言是英语——但我的女朋友是意大利人,所以她——劳拉,将评估我们讲意大利语的BERT模型——FiliBERTo的结果。因此,要下载OSCAR数据集的意大利语部分,我们将使用...
详情
OSCAR数据集拥有大量不同的语言——从头开始训练最清晰的用例之一是我们可以将BERT应用于一些不太常用的语言,例如泰卢固语或纳瓦霍语。我的语言是英语——但我的女朋友是意大利人,所以她——劳拉,将评估我们讲意大利语的BERT模型——FiliBERTo的结果。因此,要下载OSCAR数据集的意大利语部分,我们将使用...