谷歌翻译陷入「辱华」风波:夹带私货还是训练语料背锅?
2021年11月27日 - 网易
所谓Phrased-based,即翻译的最小单位由任意连续的词(Word)组合成为的短语(Phrase)。首先,算法会把句子打散成一个个由词语组成的词组(中文需要进行额外的分词);然后,预先训练好的统计模型会对于每个词组,找到另一种语言中最佳对应的词组;最后,需要将这样「硬生生」翻译过来的目标语言词组,通过重新排序,让它看起来...
详情
2017年12月英语六级翻译:电影
2017年8月11日 - 新东方
第三句的翻译采用了“倒装”的译法。(4)“默片”译为“filmsthataremute”,“有声电影”译为“filmsthatspeak”。为了保持语言结构的对称,“默片”和“有声电影”的翻译都采用了定语从句的结构。
详情
那边人机大战不断,这边有道把人和机器撮合起来开发了一个翻译工具
2017年2月16日 - 百家号
根据剑桥大学自然语言处理(NLP)组的陈村在一篇文章中的描述,传统机器翻译界的主流方法都是Phrased-BasedMachineTranslation(PBMT),此前连Google翻译使用的也是基于这个框架的算法。所谓基于词组,就是将原语句中的话拆成词组,在对应词组进行逐一翻译,最后再把顺序汇总成目标语言的一句话。比如说“今天我想...
详情
十分钟读完人工智能的三生三世
2018年5月25日 - 网易
历史上自然语言生成的典型应用一直是机器翻译。传统方法是一种名为Phrased-BasedMachineTranslation(PBMT)的方法:先将完整的一句话打散成若干个词组,对这些词组分别进行翻译,然后再按照语法规则进行调序,恢复成一句通顺的译文。整个过程看起来并不复杂,但其中涉及到了多个自然语言处理算法,包括中文分词、词性标注、句法...
详情