业内首个古彝文编码“大字典”发布 ,AI为古文字打造“身份证”
环球网科技综合报道9月26日消息,近日,合合信息联合上海大学、华南理工大学发布业内首个古彝文基础编码数据库,该项目由合合信息与上海大学社会学院、华南理工大学文档图像分析识别与理解实验室共同推进,针对现有的《西南彝志》、云贵一带字符,以智能图像处理、智能文字识别等AI技术开展统一编码,使古彝文在数字社会中...
古彝文——唯一存活的世界六大古文字
目前,《滇川黔桂彝文字集》共收录古彝文单字87,000多个,而世界古文字没有一种文字能够达到这样的体量。可以说,古彝文真正体现了承担彝族语言载体的功能,是发育比较成熟、稳定和具有厚实饱和度的文字。04、古彝文的传承力古彝文的传承与保护贵州省毕节市有着悠久的彝族历史和丰富的文化遗产,是彝族古文献典籍最为...
书艺纤毫间,彝乡古墨香|艺术|彝族|中国书法|少数民族|传统文化...
多年来,田玉华不断钻研彝文书法的技法和内涵,多次参加省内外书法展览,他创作完成的彝文书法作品《彝家千字文》高0.8米、长19.35米,是当时中国最长、最大的彝文书法作品,引起了广泛关注,他希望通过这样的方式,让更多的人了解到彝族独有的文化。除了创作和展示,田玉华还注重培养彝文书法的后继人才,他积极开...
中国发现一种古文字,学者:距今已有万年,是西方文字的始祖
彝文是中国第六大民族——彝族的文字,与汉字一样都是表意方块字,造字方式也与汉字大致相同,不过具体形成时间众说纷纭,有说是模仿“六国文字”而造,有说是“唐创宋成”,有说是“明创清成”,但以如今幸存的彝族文献来看,石刻与纸质文书大约有1.2万册,民间大约还有0.5万册没有纳入统计,文献内容非常丰富,涉及历史、...
总量比《康熙字典》还多,一个字有几十种写法……合合信息用AI挑战...
从总量上看,未经整理规范的古彝文字符数高达八万七千多个,比《康熙字典》的四万七千余字还多。据古彝文数字化团队研究人员透露,若想要找到某个字在一本古籍里的全部样例,手动查阅需要耗费一整天,如建立起完善的古彝文数据库和翻译系统,可极大提升研究效率。“汉文古籍识别所面对的页面残损、字形复杂、字迹模糊等...
汉彝文字:中华文化同根同源的历史见证
明清两代传记和志书记载,古彝文“字如蝌蚪、字母一千八百四十”(www.e993.com)2024年12月18日。用古彝文记录的典籍涉及内容广泛,蕴含着大量生产与生活的经验总结和智慧结晶,具有很高的学术研究价值和当代适用价值。1980年,国务院颁布实施的《彝文规范方案》选取819个古彝文字,构建了新的规范彝文音节文字符号体系,更加稳固了彝文由表意文字向表音...
古文字有了“身份证”!合合信息、上海大学、华南理工大学联合发布...
再者,古彝文异体字繁多,每个字的异体写法少则两三种,多则几十种,且字体间风格差异大。因此,建立一个专门的数据库,通过基础编号能够将不同样式归纳,才能“破解”古彝文“一对多”的关系,解决文字查询问题。古彝文字符多样性无统一规范样式,数据库查询编码:09460502...
《奢香夫人》背后的古彝族文字如何传承?合合信息、上海大学、华南...
再者,古彝文异体字繁多,每个字的异体写法少则两三种,多则几十种,且字体间风格差异大。因此,建立一个专门的数据库,通过基础编号将不同样式归纳,才能“破解”古彝文“一对多”的关系,解决文字查询问题。古彝文典籍编码、识别过程(图源:西南彝志)在对7万6千字符的样本进行训练后,团队成功建立了包含上千个...
合合信息发布首个古彝文基础编码“大字典”,用AI“抢救”濒危语言
根据《滇川黔桂彝文字集》,古彝文多达87046字,比《康熙字典》(47035字)还要多。在目前发现的彝文古籍中,《西南彝志》是其中字数最多、篇幅最长、体量最大、内容最丰富的巨著,有“彝族古代百科全书”之誉。古彝文作为一门濒临消亡的语言,其典籍的数字化之路也面临着巨大的挑战。
...华南理工大学发布业内首个古彝文编码“大字典” ,为古文字打造...
再者,古彝文异体字繁多,每个字的异体写法少则两三种,多则几十种,且字体间风格差异大。因此,建立一个专门的数据库,通过基础编号将不同样式归纳,才能“破解”古彝文“一对多”的关系,解决文字查询问题。古彝文典籍编码、识别过程(图源:西南彝志)在对7万6千字符的样本进行训练后,团队成功建立了包含上千个古彝文...