6个现代汉语语料库推荐
1.北京大学CCL现代汉语语料库httpccl.pku.edu:8080/ccl_corpus/2.北京语言大学BCC语料库httpbcc.blcu.edu/3.国家语委现代汉语语料库httpcorpus.zhonghuayuwen/cncindex.aspx4.北京语言大学口语语料查询系统httpblcu.edu/col/col15865/index.ht
干货| 语言研究必备的37个常用语料库
CCL语料库中古代汉语语料约2亿字符,收录了从周代到民国的语料及大藏经、二十五史、历代笔记、十三经注疏、全唐诗、诸子百家、全元曲、全宋词、道藏、辞书、蒙学读物等的杂类语料。除了两大单语语料库的扩容外,近年来CCL语料库还融入了一些专题语料库,例如:早期北京话材料、留学生汉语作文语料、汉语构式语料库、中文...
翻译必备术语库和语料库合集(附网址)!
httpnatcorp.ox.ac.uk/BOE——柯林斯英语语料库(theBankofEnglish):httpcollinslanguage/language-resources/dictionary-datasets/ANC——美国国家语料库(AmericanNationalCorpus):httpsanc/兰开斯特汉语语料库(LCMC):httpota.oucs.ox.ac.uk/scripts/download.p...
科研方法 | 翻译常用的22个语料库
BCC汉语语料库httpbcc.blcu.edu/BCC汉语语料库,总字数约150亿字,包括:报刊(20亿)、文学(30亿)、微博(30亿)、科技(30亿)、综合(10亿)和古汉语(20亿)等多领域语料,是可以全面反映当今社会语言生活的大规模语料库。11美国国家语料库httpanc/1212英国国家语料库htt...
干货|国内最常用的17个语料库
CCL语料库(httpccl.pku.edu:8080/ccl_corpus/index/jsp?=xiandai)中包含现代汉语语料、古代汉语语料两类单语语料,涉及的文献时间从公元前11世纪到当代。其中现代汉语语料约6亿字符,涵盖了文学、戏剧、报刊、翻译作品、网络语料、应用文、电视电影、学术文献、史传、相声小品、口语等多个类型。CCL语料库中古...
CCL 2020闭幕,数万人见证2020年中国NLP全貌剪影
“伟大的男人和倔强的女人:基于语料库的形容词性别偏度历时研究”,朱述承,刘鹏远.北京语言大学3.最佳系统展示奖文本理解系统TexSmart,腾讯AILab3多种形式,聚焦NLP研究方方面面在10月30日,清华大学刘知远副教授、中科院计算所沈华伟研究员、上海交通大学张伟楠副教授、新加坡国立大学雷文强博士分别就...
精品推荐 | 中国翻译必用的22个极优质语料库
httpsludwig.guru/20北京大学中国语言学研究中心httpccl.pku.edu:8080/ccl_corpus/21北外语料库语言学httpcorpus.bfsu.edu/22联合国正式文件系统httpsdocuments.un/prod/ods.nsf/home.xsp转自:语言学人往期精品...
“登陆网站”还是“登录网站”?
它可为用户提供电子邮件、文件传输、远程登录等网络服务。(《人民日报》1996年,北大CCL语料库)而网络中的“登陆”最早出现在1999年《人民日报》的语料中:“亚洲资源”目前是全球100家最佳专业国际贸易网站之一……初次登陆“亚洲资源”,许多人在电脑前长时间逗留。(戎霄《面对面交易会过时吗——华交会见闻》,《人...
“只”与“支”:债券量词选用浅析
在北京大学中国语言学研究中心(CCL)语料库中,“只”与“债”相连接可搜索到38条结果,来源包括《人民日报》、新华社等;“支”与“债”相连接只搜索到1条结果,来源为新华社2002年9月的新闻报道。从语料库的搜索情况来看,几乎全部以“只”作为债券的量词,选用“支”的情况极少。这与搜索引擎所反映的比例关系有...
崔希亮 | 汉语“算了”的情态意义及语法化动因
表2CCL语料库中“算了”与主观意念表达共现频次3.2客观情态而另一个形式“也就算了”如果出现在让步复句中的前项,如“个子矮也就算了,还长得那么丑!”它与言者的主观态度相联系,意义为“不得已对某一选项的接受或认可”,如果出现在陈述句中,如“他一次又一次地挑衅,见和尚不接招,也就算了”“他看看自...