专访85岁冯志伟教授:一个北大中文系学生的机器翻译之梦
冯志伟通过复杂的计算,得出一个结论,只要统计12,368种常见汉字的频度就可以计算出汉字熵,而不用必须统计所有6万多个汉字的频度。可是,在那个没有计算机,所有文字都是纸质形式的年代,统计1万多个汉字的频度也是巨大的工作量。冯志伟想到了找当地的中学老师们帮忙统计汉字频度。当时,大部分工作都已经停止,很...
汉字在日本的传播及影响
据日本国立国语研究所开发、拥有1.45亿词汇量的现代日语书面语平衡语料库(以下简称“BCCWJ”)统计数据显示,在非重复统计下,汉字词的数量占BCCWJ总词汇量的43.59%,远远超过了日语固有词汇32.98%的占比。但BCCWJ的统计数据只考虑了直接借用的汉字词,而研究发现,还有大量包含汉字成分的混合词。如名词“台所”(だいどこ...
总数有九万多常用只有三千五 最新汉字统计出炉
与庞大的汉字库形成鲜明对照的是,历代日常书面语常用的不同的汉字数量一般都控制在三四千个。数量上并没有超过最初的文字甲骨文。国家在1988年公布的《现代汉语常用字表》选收了2500个常用字、1000个次常用字,总共只有3500字。生僻字逐渐淘汰国家语言文字工作委员会语言文字应用研究所前副所长纪恒铨认为,一个国家...
2024年南京邮电大学硕士研究生考试大纲
语法知识以及日语阅读与写作等方面的技能,要求考生具有良好的日语基本功,掌握2000字左右的汉字,认知词汇量在13,000以上,掌握8,000个以上的积极词汇,即能正确而熟练地运用常用词汇及其常用搭配,能熟练掌握正确的日语语法、
【深度专访】初晓波教授访谈——中国的日本研究:历史、现状与展望
本文约24720字,读完约62分钟初晓波北京大学国际关系学院党委书记、教授北京大学中外人文交流研究基地学术委员01不同历史阶段中国的日本研究李尧星(以下简称“李”):在中国现存历史资料中,最早关于日本的记述始于什么时候?初晓波(以下简称“初”):作为一衣带水的邻邦,对中国而言,日本是一个具有独特意义的“他...
杂志公布2010年十大语文差错 董卿口误“中彩”
三、统计数量时常混淆的词:截止/截至(www.e993.com)2024年12月20日。“截止”的意思是停止,如“活动已于昨日截止”;而用于某一时间之前的应当是“截至”,如“截至昨日,已有上千人报名”。四、新闻报道中容易错的词:侧目。如:“他的研究成果解决了十多亿人的吃饭问题,令世界为之侧目。”所谓“侧目”,是指斜目而视,在这里应改为“瞩目...
2009年中国语言生活状况报告
2009年度用字总表中,包括了繁体字、异体字、不规范的类推简化字、旧计量单位用字、日本汉字等共计1804个,占全部年度用字的17.68%。2.五年用字总表的高频字稳定,年度特色用字使用频率变化较大五年的用字调查显示,覆盖率达到80%、90%、99%的汉字个数分别在581~602、934~971、2314~2400之间,其占汉字总数...