合合信息与上海大学联合开启贵州原生态古彝文典籍数字化项目
项目将根据上海大学古彝文研究员设计的四字节编码系统,引入合合信息智能文字识别技术,对异体字、变体字、误用字和混用字等进行标注、识别、比对,并由此建立起精确的彝文古籍电子数据库,在古彝文研究领域属于首创。“汉文古籍识别所面对的页面残损、字形复杂、字迹模糊等问题,在彝文古籍识别中全部存在,还有一些任务是更加...
汉彝文字:中华文化同根同源的历史见证
彝文字历史悠久,文献典籍丰富,具有重要的文化价值和研究价值。汉字和彝文字均为方块文字,是世界六大古文字中仅存的仍在使用的两种文字。文字特征、字体结构、用字方法等方面的相同之处,是汉彝文字同源的力证;汉字的“六书”造字法是表意文字的创制典范,在彝文中也有印证。汉彝文字共同书写了伟大祖国的光辉历史,成为...
古彝文——唯一存活的世界六大古文字
汉语“双语教学”,培养了一大批彝文专业人才,为抢救、保护、传承彝族文化发挥了积极作用;并且还将古彝文作为打造、传播彝族文化的重要元素,展现彝族文字之美,创建古彝文化景观。
“改土归流”导致凉山彝语文严重变化
今云南彝文和贵州彝文均横写横看,独凉山彝文横写竖看。此何原由?横写竖看的凉山彝文改土归流致凉山纷争一切的根源,均从改土归流开始说起。凉山曾经有过短暂的统一,元朝在凉山设置罗罗宣慰司,彝称利利兹莫,利利兹莫领土极大,基本涵盖凉山大部分地区。此时的凉山彝族与云南贵州彝族尚可交流,贵州水西阿哲家曾...
...字典》还多,一个字有几十种写法……合合信息用AI挑战古彝文识别
对古彝文字集研究有助于理解尚未被翻译成汉文、用字尚未规范化的古籍,更深层、透彻地作用于传统文化保护。但古彝文的传统识别非常困难,除了原籍难获以外,翻译过程繁琐,很多时候甚至需要十年起步。2022年12月21日,合合信息与上海大学社会学院正式签署校企合作协议,双方将合力完成以国家珍贵古籍《西南彝志》为中心...
中国古文字书法图鉴:彝文、古壮字、白文
对于彝文造字法,学者们各执一词(www.e993.com)2024年11月24日。笔者认为彝文造字有三种方法:一是象形造字法,以具体或抽象的方式造出部分图形性较强的文字。二是指意造字法,在已有文字的基础上,增加一些附加符号,创造出一些新的文字来表达其意。三是变体造字法,即在原有字的基础上,采用转位、增减笔画等手段,创造出一些新的字体。
《奢香夫人》背后的古彝族文字如何传承?合合信息、上海大学、华南...
据《滇川黔桂彝文字集》中所有字符的合计,古彝文和现在仍然使用的各地的彝文,总数多达87046字,对如此庞大的字符集进行分类非常困难。另一方面,在彝文的发展过程中,由于种种因素,导致异体字、变体字特别丰富,字符和释义“一对多、多对一”是常态。古彝文手写体的随意性、多样性等,都给古彝文的识别带来了...
合合信息与上大社会学院联合用AI技术挑战古彝文识别难关
由于古彝文尚未取得预留的Unicode编码区段,数字化工程还处于起步阶段,所以在印刷出版时,需由一位彝文缮写员先将彝文字和国际编码抄写在书页的左侧,再将已输入电脑的汉文译文打印、剪切后粘贴在相应彝文字的右侧,形成目前常见的“四行体”彝汉文对译,过程相对烦琐。
合合信息发布行内首个古彝文编码“大字典”用AI为古文字开启“焕...
2022年12月,合合信息与上海大学、华南理工大学共同开启以国家珍贵古籍《西南彝志》为中心的贵州古彝文图像识别及数字化校对项目,引入AI技术提升古籍识别效率,从异体字、变体字、误用字和混用字中提炼出编码。在对7万6千字符的样本进行训练后,团队近期成功建立了包含上千个古彝文基础编码的数据库,堪称古彝文编码“大...
我在北京用彝文翻译全国两会的文件
阿克日布的任务,是和其他工作人员一起,将这些文件翻译成彝文。阿克日布介绍,彝文组一共有19人,其中借调专家5人,来自凉山州4人。有的专家多次参加翻译,而他是第一次参加全国两会的翻译工作。按照民族语文翻译组的通知要求,凉山州4名借调专家于2022年2月20日飞抵北京,与彝语文室在京人员、在成都人员及其他六个...