业内首个古彝文编码“大字典”发布 ,AI为古文字打造“身份证”
再者,古彝文异体字繁多,每个字的异体写法少则两三种,多则几十种,且字体间风格差异大。因此,建立一个专门的数据库,通过基础编号将不同样式归纳,才能“破解”古彝文“一对多”的关系,解决文字查询问题。在古彝文语料收集过程中,研究团队通过合合信息旗下的“扫描全能王”来进行古籍图片采集。其“智能高清滤镜”功能...
汉彝文字:中华文化同根同源的历史见证
文字特征、字体结构、用字方法等方面的相同之处,是汉彝文字同源的力证;汉字的“六书”造字法是表意文字的创制典范,在彝文中也有印证。汉彝文字共同书写了伟大祖国的光辉历史,成为中华文化同根同源的历史见证。源远流长:仅存的两种世界古文字学术界公认的世界六大古文字为苏美尔楔形文、埃及圣书文、印度哈拉般...
古彝文——唯一存活的世界六大古文字
规范彝文是将古彝文通过顺时针旋转90度形成的一种变体文字,以彝语北部方言圣乍话为基础方言,以喜德语音为标准音,根据笔画不多、结构简单、书写方便、字形美观的原则,选用古彝文中819个字,分别表示标准音点的819个音节。这一方案的出台,标志着彝文规范工作的重大突破,也为彝文的传承与发展奠定了坚实基础。1980年,《...
中国发现一种古文字,学者:距今已有万年,是西方文字的始祖
彝族学者戈隆阿弘在《被遗忘的中国远古部落族群》一文中指出,古彝文对西方的影响,至今还留有遗迹,比如意大利4000年前的岩石刻符,希腊3000年前的线性文字A与B,印度4000年前的古文字,与古彝文的字形笔划和书写方法都相同相似,部分文字甚至可以用古彝文解读。正因如此,刘志一教授断言:“古彝文是汉文的源头,西文的始祖...
...字典》还多,一个字有几十种写法……合合信息用AI挑战古彝文识别
表示“种类”的彝文字[mo21]/[m??33]的四个极为相似的变体。两个形似、但音义完全不同的彝文字,字义分别为“酒”、“仪礼”。亟待识别的古彝文,比《康熙字典》字数还多此前,在中国西南多家高校的共同努力下,规范和通用彝文的数字化工作取得了重要突破,而上海大学携手合合信息推进的古彝文数字化项目,...
《寻秘大方》——最鲜活的古彝文字
由此可知,“爨”原是当时的一种大姓(www.e993.com)2024年11月24日。“爨”由姓氏变为族名,最早见于樊绰的《蛮书·名类篇》。书中说,西爨为白蛮,东爨为乌蛮,即今天的彝族。明清以来的汉文方志中,多称彝族文字为“爨”字。如《天启滇志》卷三十《爨夷条》:“有夷经,皆爨字,状类蝌蚪。”...
《奢香夫人》背后的古彝族文字如何传承?合合信息、上海大学、华南...
单一古彝文可表达多个释义(图源:《滇川黔桂彝文字集》)当前,古彝文数字化方面的成果相对较少,其原因之一是古彝文字符集庞大,且缺乏成熟的手写样本库。据《滇川黔桂彝文字集》中所有字符的合计,古彝文和现在仍然使用的各地的彝文,总数多达87046字,对如此庞大的字符集进行分类非常困难。另一方面,在彝文的...
用AI“抢救”濒危古文字 合合信息发布古彝文基础编码“大字典”
“古彝文”专指在民间流通使用的原生态彝文。根据《滇川黔桂彝文字集》,古彝文多达87046字。古彝文作为一门“濒临”消亡的语言,其典籍的数字化之路也面临着巨大的挑战。古彝文基础编码数据库项目技术负责人、华南理工大学电子与信息学院教授金连文提到,原生态彝文此前没有被系统性地进行数字化编码,古彝文没有公开数...
合合信息发布首个古彝文基础编码“大字典”,用AI“抢救”濒危语言
根据《滇川黔桂彝文字集》,古彝文多达87046字,比《康熙字典》(47035字)还要多。在目前发现的彝文古籍中,《西南彝志》是其中字数最多、篇幅最长、体量最大、内容最丰富的巨著,有“彝族古代百科全书”之誉。古彝文作为一门濒临消亡的语言,其典籍的数字化之路也面临着巨大的挑战。
...华南理工大学发布业内首个古彝文编码“大字典” ,为古文字打造...
当前,古彝文数字化方面的成果相对较少,其原因之一是古彝文字符集庞大,且缺乏成熟的手写样本库。据《滇川黔桂彝文字集》中所有字符的合计,古彝文和现在仍然使用的各地的彝文,总数多达87046字,对如此庞大的字符集进行分类非常困难。另一方面,在彝文的发展过程中,由于种种因素,导致异体字、变体字特别丰富,字符和释义“...