CCL 2020闭幕,数万人见证2020年中国NLP全貌剪影
(3)“面向中文AMR标注体系的兼语语料库构建及识别研究.”侯文惠,曲维光,魏庭新,李斌,顾彦慧,周俊生.南京师范大学(4)“面向司法领域的高质量开源藏汉平行语料库构建.”沙九,周鹭琴,冯冲,李洪政,张天夫,慧慧.北京理工大学2.最佳海报奖“伟大的男人和倔强的女人:基于语料库的形...
6个现代汉语语料库推荐
1.北京大学CCL现代汉语语料库httpccl.pku.edu:8080/ccl_corpus/2.北京语言大学BCC语料库httpbcc.blcu.edu/3.国家语委现代汉语语料库httpcorpus.zhonghuayuwen/cncindex.aspx4.北京语言大学口语语料查询系统httpblcu.edu/col/col15865/index.ht
干货|国内最常用的17个语料库
CCL语料库中古代汉语语料约2亿字符,收录了从周代到民国的语料及大藏经、二十五史、历代笔记、十三经注疏、全唐诗、诸子百家、全元曲、全宋词、道藏、辞书、蒙学读物等的杂类语料。除了两大单语语料库的扩容外,近年来CCL语料库还融入了一些专题语料库,例如:早期北京话材料、留学生汉语作文语料、汉语构式语料库、中文...
干货| 语言研究必备的37个常用语料库
CCL语料库中古代汉语语料约2亿字符,收录了从周代到民国的语料及大藏经、二十五史、历代笔记、十三经注疏、全唐诗、诸子百家、全元曲、全宋词、道藏、辞书、蒙学读物等的杂类语料。除了两大单语语料库的扩容外,近年来CCL语料库还融入了一些专题语料库,例如:早期北京话材料、留学生汉语作文语料、汉语构式语料库、中文...
科研方法 | 翻译常用的22个语料库
BCC汉语语料库,总字数约150亿字,包括:报刊(20亿)、文学(30亿)、微博(30亿)、科技(30亿)、综合(10亿)和古汉语(20亿)等多领域语料,是可以全面反映当今社会语言生活的大规模语料库。11美国国家语料库httpanc/1212
“登陆网站”还是“登录网站”?
它可为用户提供电子邮件、文件传输、远程登录等网络服务(www.e993.com)2024年11月19日。(《人民日报》1996年,北大CCL语料库)而网络中的“登陆”最早出现在1999年《人民日报》的语料中:“亚洲资源”目前是全球100家最佳专业国际贸易网站之一……初次登陆“亚洲资源”,许多人在电脑前长时间逗留。(戎霄《面对面交易会过时吗——华交会见闻》,《人...
不懂就问!人人都想拥有的“开挂”的英文咋说?
我们首先查阅了北京大学中国语言学研究中心(CCL)语料库及北京语言大学智能研究院研发的BCC汉语语料库,发现“开挂”的总体搜索结果较少,说明“开挂”是新词,但是我们也看到,“开挂”已经开始出现在《人民日报》等权威媒体中。此外,它不再是具有“欺骗”含义的贬义词,而是与“10岁上大学”“没用过电脑的农村孩子上...
“只”与“支”:债券量词选用浅析
在北京大学中国语言学研究中心(CCL)语料库中,“只”与“债”相连接可搜索到38条结果,来源包括《人民日报》、新华社等;“支”与“债”相连接只搜索到1条结果,来源为新华社2002年9月的新闻报道。从语料库的搜索情况来看,几乎全部以“只”作为债券的量词,选用“支”的情况极少。这与搜索引擎所反映的比例关系有...