字数多于《康熙字典》,合合信息智能文字识别赋能上海大学构建古...
古彝文与汉字并非一一对应关系,存在大量的异体字、变体字。在相对规范的汉译本彝文典籍中就有至少15%的变体字,原稿中只会更多;每个字的异体写法少则2-3个,多则几十种。从总量上看,未经整理规范的古彝文字符数高达八万七千多个,比《康熙字典》的四万七千余字还多。据古彝文数字化团队研究人员透露,若想...
字数多于《康熙字典》,校企联合AI赋能古彝文识别
从总量上看,未经整理规范的古彝文字符数高达八万七千多个,比《康熙字典》的四万七千余字还多。据古彝文数字化团队研究人员透露,若想要找到某个字在一本古籍里的全部样例,手动查阅需要耗费一整天,如建立起完善的古彝文数据库和翻译系统,可极大提升研究效率。“汉文古籍识别所面对的页面残损、字形复杂、字迹模糊等问题...
总量比《康熙字典》还多,一个字有几十种写法...合合信息用AI挑战...
从总量上看,未经整理规范的古彝文字符数高达八万七千多个,比《康熙字典》的四万七千余字还多。据古彝文数字化团队研究人员透露,若想要找到某个字在一本古籍里的全部样例,手动查阅需要耗费一整天,如建立起完善的古彝文数据库和翻译系统,可极大提升研究效率。表示“种类”的彝文字[mo21]/[m??33]的四个极为相似...
No19:表音文字,表意文字,形意文字之比较(中)
在我国最完备的《康熙字典》(该字典成书于清康熙55年,即1716年)计42卷,分214部首,共收有四万七千余字(40743个但其中大都为古字、俗字和旧字体等,除历史文献和古文字外,早已摒弃不用,常用字约十分之一弱。即3600字上下)。在我国出版的些汉语大词典》中收集汉字5万5千余个单字,再考查我国最近新编...
合合信息与上大社会学院联合用AI技术挑战古彝文识别难关
12月21日,静安知名科技企业合合信息公司与上海大学社会学院签署校企合作协议,双方将合力完成以国家珍贵古籍《西南彝志》为中心的贵州古彝文图像识别及数字化校对项目(简称“古彝文数字化项目”)。亟待识别的古彝文比《康熙字典》字数还多彝文是云南、贵州、四川等地的彝族人使用的文字,而“古彝文”专指在民间流通...
好文荐读|江南:赵元任对外古代汉语教材编写思想研究
第三,将这214个部首按《康熙字典》中的顺序,排列在一个宽10列、长22行的表格中(见图1),“一”为起始,排第1位;“龠”为结束,排第214位,并且在笔画数相同的部首版块的第一个和最后一个部首的格子里标上部首的笔画数(www.e993.com)2024年11月11日。图1:汉字部首表(ListofRadicals)(局部)...
古代汉语名词解释大汇总
是用两个字合注一个字的音,称为“某某切”或“某某反”(唐前),上字取声母。下字取韵母合声调,合称被注字的音。如“毛”,“莫袍切”。《康熙字典》用此法。3.偏义复词古代汉语中的一种复音词,用两个单音的近义词或反义词作为词素组成,其中一个词素的本来意义成为这个复音词的意义,而另一个只是作为陪...