科研方法 | 翻译常用的22个语料库
httpbcc.blcu.edu/BCC汉语语料库,总字数约150亿字,包括:报刊(20亿)、文学(30亿)、微博(30亿)、科技(30亿)、综合(10亿)和古汉语(20亿)等多领域语料,是可以全面反映当今社会语言生活的大规模语料库。11美国国家语料库httpanc/1212英国国家语料库httpnatc...
6个现代汉语语料库推荐
1.北京大学CCL现代汉语语料库httpccl.pku.edu:8080/ccl_corpus/2.北京语言大学BCC语料库httpbcc.blcu.edu/3.国家语委现代汉语语料库httpcorpus.zhonghuayuwen/cncindex.aspx4.北京语言大学口语语料查询系统httpblcu.edu/col/col15865/index.ht
CCL 2020闭幕,数万人见证2020年中国NLP全貌剪影
(3)“面向中文AMR标注体系的兼语语料库构建及识别研究.”侯文惠,曲维光,魏庭新,李斌,顾彦慧,周俊生.南京师范大学(4)“面向司法领域的高质量开源藏汉平行语料库构建.”沙九,周鹭琴,冯冲,李洪政,张天夫,慧慧.北京理工大学2.最佳海报奖“伟大的男人和倔强的女人:基于语料库的形...
精品推荐 | 中国翻译必用的22个极优质语料库
httpbcc.blcu.edu/BCC汉语语料库,总字数约150亿字,包括:报刊(20亿)、文学(30亿)、微博(30亿)、科技(30亿)、综合(10亿)和古汉语(20亿)等多领域语料,是可以全面反映当今社会语言生活的大规模语料库。11美国国家语料库httpanc/1212英国国家语料库httpnatc...
干货|国内最常用的17个语料库
中国科学院汉英平行语料库是在对中英文篇章对齐的双语文本进行段落对齐、句子对齐加工后建立的一个句子级对齐的双语语言信息和知识库,该语料库借助互联网等其他媒体搜集中英文篇章级对齐的双语文本,面向多领域多体裁,采用基于双语辞典的句子对齐方法进行了文本对齐,并对双语文本句子对齐结果实现自动评价。
“登陆网站”还是“登录网站”?
它可为用户提供电子邮件、文件传输、远程登录等网络服务(www.e993.com)2024年11月18日。(《人民日报》1996年,北大CCL语料库)而网络中的“登陆”最早出现在1999年《人民日报》的语料中:“亚洲资源”目前是全球100家最佳专业国际贸易网站之一……初次登陆“亚洲资源”,许多人在电脑前长时间逗留。(戎霄《面对面交易会过时吗——华交会见闻》,《人...
不懂就问!人人都想拥有的“开挂”的英文咋说?
要确定“开挂”如何翻译,我们首先要了解“开挂”一词在日常应用中的具体含义,然后给出对应英文表达,再到英语语料库中验证其用法。为此,上海杉达学院语料应用与研究中心展开研究。我们首先查阅了北京大学中国语言学研究中心(CCL)语料库及北京语言大学智能研究院研发的BCC汉语语料库,发现“开挂”的总体搜索结果较少,说明...
“只”与“支”:债券量词选用浅析
不过,在个别文件中,也存在使用“支”作为量词的情况。(二)语料库的选用情况前文使用了搜索引擎来搜索“只”“支”与“债券”相搭配的情况。搜索引擎是对互联网内容的综合检索,已有的错字、病句等内容只要存在,都很有可能被检索出来。因此笔者进一步使用语料库进行搜索。语料库是指经科学取样和加工的大规模电子...
崔希亮 | 汉语“算了”的情态意义及语法化动因
表2CCL语料库中“算了”与主观意念表达共现频次3.2客观情态而另一个形式“也就算了”如果出现在让步复句中的前项,如“个子矮也就算了,还长得那么丑!”它与言者的主观态度相联系,意义为“不得已对某一选项的接受或认可”,如果出现在陈述句中,如“他一次又一次地挑衅,见和尚不接招,也就算了”“他看看自...
张伟君|南京“大牌档”维权的路径选择
其次,即便是在南京范围内,其他餐饮服务企业使用“大排档”作为店招,是否因为“大排档”与“大牌档”近似而应该被禁止使用呢?本文认为,其答案也可以是否定的。因为,连原告自己也承认北京大学中国语言学研究中心的CCL语料库收录了大量“大排档”词条。这时,如果机械地适用注册商标保护规则,就可能会导致不合理的裁判...