科技一周大事(11 月 27 日-12 月 3 日):字节跳动官宣大规模收缩...
9、拼多多美股市值超越阿里巴巴,成为美股市值最大中概股11月29日,拼多多股价上涨超3%,超越阿里巴巴成为美股市值最大中概股。拼多多市值1920亿美元(约1.37万亿元人民币),阿里巴巴1915亿美元(约1.37万亿元人民币)。>>查看详情10、消息称英伟达RTX4090D中国特供显卡采用AD102-250GPU外媒Wcc...
总量比《康熙字典》还多,一个字有几十种写法……合合信息用AI挑战...
表示“种类”的彝文字[mo21]/[m??33]的四个极为相似的变体。两个形似、但音义完全不同的彝文字,字义分别为“酒”、“仪礼”。亟待识别的古彝文,比《康熙字典》字数还多此前,在中国西南多家高校的共同努力下,规范和通用彝文的数字化工作取得了重要突破,而上海大学携手合合信息推进的古彝文数字化项目,...
字数多于《康熙字典》,合合信息智能文字识别赋能上海大学构建古...
项目将根据上海大学古彝文研究员设计的四字节编码系统,引入合合信息智能文字识别技术,对异体字、变体字、误用字和混用字等进行标注、识别、比对,并由此建立起精确的彝文古籍电子数据库,在古彝文研究领域属于首创。亟待识别的古彝文,比《康熙字典》字数还多彝文是云南、贵州、四川等地的彝族人使用的文字,而“古...
字数比《康熙字典》还多!合合信息与上海大学联合开启贵州原生态古...
字数比《康熙字典》还多!合合信息与上海大学联合开启贵州原生态古彝文典籍数字化项目图说:上海大学社会学院院长黄晓春、合合信息智能技术平台事业部副总经理郭丰俊出席签约仪式采访对象提供(下同)古彝文传承至今已有数千年历史,是世界上最古老的文字之一。12月21日,合合信息与上海大学社会学院正式签署校企合作协...
中青报:数字时代,如何守护困在信息系统“盲区”的生僻字?
谭景春表示,“汉字收录在《康熙字典》里的有4万多个,收录在《汉语大字典》里的有6万多个,收录在《中华字海》里的有87019个。不过现代通用的也就5000到8000个,比如2013年6月,由国务院正式发布的《通用规范汉字表》收录了8105个汉字”。几千年来,汉字在维护民族和国家的统一,记录和保存文化遗产等方面发挥了巨大的...
古文字有了“身份证”!合合信息、上海大学、华南理工大学联合发布...
(图源:滇川黔桂彝文字集)用AI技术帮助古彝文打造“身份证”据了解,传统的古彝文来源于岩书、布书、竹简等,在潮湿的自然环境下难以完整保存,即便被拍摄成图片,斑驳的画面也影响了后续的内容识别(www.e993.com)2024年11月11日。在收集语料收集过程中,研究团队采用了合合信息旗下扫描全能王的“智能高清滤镜”功能,高效解决古彝文图像电子化的问题...
河北大学中华字库工程探访:他们给汉字填写“身份”信息
第一个字,虽在《康熙字典》《汉语大字典》《中华字海》这样的大型字书中有收录,但被作为双音节词用字处理,至于读音,书中却未给出。第二个字大型字书都没有收录。与这些令普通人直皱眉头,甚至大型字书中都未给出答案或没有收录的疑难字打交道,对它们追根溯源,辨析渊源流变,是河北大学文学院汉语言文字学教授...
揭秘:纳税人必用的个人所得税APP,如何解决姓名生僻字难题
其中,在人口信息生僻字库“方正宋体-人口信息”的现有版本中,共收录汉字75586个,包含《康熙字典》《汉语大字典》的所有汉字,涵盖了各地整理上报的全部地名用字、姓氏用字和使用频度较高的人名用字。方正典码输入法是人口信息字符集专门配套的输入法。根据汉字的部首、笔画、笔顺、笔画数等特征作输入汉字的检索条件,...
《康熙字典》错误2万条被指为“不合格产品”
“《康熙字典》集30多位学者之力,是集体创作的成果,而学者之间难免水平参差不齐;而且6年的时间编纂一本收录了4.7万余字的字典,速度不可谓不快,有所漏洞也在意料之中”。而关于这些错讹,孙毕表示,目前大部分出版社还是以保持古字典的原貌为主,上海辞书社的《康熙字典》(标点整理本)只是在注音、断句上进行了...
教育部语言文字信息管理司回应“六安”读音:将把市民的建议纳入...
在央视新闻频道、财经频道近日播出的多档新闻节目中,多位主播将六安读作“liùān”。而在安徽卫视、六安广播电视台的新闻节目中,主播仍将六安读作“lùān”。5月20日上午,中华人民共和国教育部语言文字信息管理司相关工作人员向新安晚报、安徽网、大皖新闻记者表示,他们也将把市民的建议纳入其中来讨论。本报...