保存汉字的百年努力,能让它留在AI时代吗?
这种使用26个字母、4个字母一组的编码方式的最大字码容量约为数学公式:26??≈46万,远超中国人的常用汉字数量(3500字)。在那篇文章结尾,支秉彝展望了“见字识码”的应用,并谦虚地表示:“‘信息化时代’的一个重要课题是‘汉字(语)信息化’。通向‘信息化时代’的殿堂,也许还有千门万户,‘见字...
汉字光标准化和数字化就花了一百多年,它能在 AI 时代存续吗丨晚点...
这种使用26个字母、4个字母一组的编码方式的最大字码容量约为数学公式:26??≈46万,远超中国人的常用汉字数量(3500字)。在那篇文章结尾,支秉彝展望了“见字识码”的应用,并谦虚地表示:“‘信息化时代’的一个重要课题是‘汉字(语)信息化’。通向‘信息化时代’的殿堂,也许还有千门万户...
【文脉华章】我们何以为中华民族||翁淮南
3000多年来,“中”“华”“民”“族”和“中华民族”内涵得以延续。汉字是世界唯一延续至今且仍在使用的自源文字系统。文字的起始阶段超越殷墟甲骨文。中国早在距今8000年—7000年的淮河流域,柳林溪遗址出土的图案,被认为是完整的九宫图形。初现于距今9000年兴盛于距今6500年—5000年的彩陶文化,如半坡的鱼纹、庙底...
汉字,终将击败英、法、西班牙文,成为人类未来的官方文字!
因此汉字保持了惊人的稳定性,学会3000常用汉字就能进行正常的学习和生活。即使那些专业词汇,大部分人也能一看就明白个七七八八。这就是汉字的强大之处!2、口音变异的挑战所谓一方水土养一方人,口音变异非常常见,如果两个地区的人不进行沟通往来,在若干年之后,两地口音会出现非常大的差异,如果时间更久,这种差异甚至...
「文字文明」金岷彬:今天中文走向世界,离不开计算机汉字学的一路...
鉴于除了电脑字库字表之外,还有《通用汉字表》、《常用汉字表》的实际使用,金岷氏曾经提议制定一个《标题用电脑汉字表》。因为需要汉字发展更多的电脑新字体、艺术字形方面,并非要求汉字的正文字体多样变化,而只要标题字体的丰富多彩。制定标题字表,可以减少设计新字体的字数,便于新字体的设计、生产、流通。现在,...
干货| 语言研究必备的37个常用语料库
通用型汉英平行语料库分为,“百科语料库”“翻译文本库”“双语语句库”以及“专科语料库”四个子库,目前3000万字词语料已基本做到句级对齐,其中2000万字词语料已完成最终校对、标注、双语链接(www.e993.com)2024年10月14日。12南京农业大学典籍平行语料库基于十三经、《战国策》、前四史等典籍及其所对应的白话文和英文翻译,南京农业大学王东波...
太全了,新闻报道的常见差错及处理(新华社整理总结)
3.技术性差错。这类错误所占的比例最大,包括题文不一、电头错、标点错,以及掉字、掉段、多字、错别字等等。这些“小错误”有时也可能导致事实性差错甚至政治性差错。另外,还有因漏报、迟报,或将未定稿乃至涉密文件当成新闻稿发表等等造成的差错。
中国民间四大禁忌风俗,有多少人可以循规蹈矩?
以科学角度来解释的话,起名字的第一个禁忌就是避免使用生僻字,尽量使用3000多个常用汉字。如果名字中出现生僻字,不但自己不容易书写,也不利于别人辨认和称呼,更不利于电脑系统的识读。许多生僻字电脑中并未录入,当个人在填写档案、办理证件、开设账户时,想让电脑输出和打印几乎不可能,会带来很大麻烦。
机关笔杆子公文写作常见的语法差错,都有哪些?
句子中的常见差错一、并列成分的结构宜保持一致例如:(1)这个连队的战士今年多次参加救灾、扶贫、共建精神文明、和谐社会创建等活动。这个句子中“参加”后并列的“救灾”“扶贫”“共建精神文明”都是动宾结构的,唯独后面的“和谐社会创建”是主谓结构的,宜将其改为“创建和谐社会”,以便跟前面几项并列的成分...
小学语文学什么,你全知道吗?都在收藏!不要错过!
小学语文知识点总结汉字▊一、要点1、认识常用的汉字3000个左右,掌握常用汉字2500个,能读准字音,认准字形,了解字义。2、辨析形近字、同音字、多音和多义字。3、掌握汉字的基本笔画、笔顺规则、偏旁部首和间架结构,知道一些汉字的基本知识。4、掌握音序查字法、部首查字法和数笔画查字法三种查字典的方法...