绝学回响 | 人工智能推动古文字研究呈现新面貌
通过在合成文字(不存在的文字)数据集上进行预训练,并在真实文字数据集上调优和度量学习,智能模型开始具有了对零样本古文字(从未见过的古文字)进行识别的能力,这是一个很大的进步。古文字识别模型现在已经能够面向一些现实任务,比如在荷兰等地的档案馆,智能模型已经用于识别和转写古代档案文书,大大提高了整理效率。古文...
识别金文困难重重和甲骨文傻傻分不清楚?
首先,殷墟甲骨文是自发现至今120多年来,已公布约十六万片的甲骨文,在古文字学、语言学、历史学等领域均取得丰硕成果,呈现综合化、精细化的特点。而金文则是古代金属器物上铸刻的文字,被称为钟鼎文,和甲骨文相比,金文更具有象形和抽象的特点。虽然金文和甲骨文都是古代文字,但是它们的表现形式和历史文化内涵却大不...
合合信息登上《人民日报》,IPO科创属性获关注
2021年、2022年的世界人工智能大会上,合合信息展现了智能文字识别技术在甲骨文识别、金文(西周钟鼎文)识别方面的应用,展现了AI“看清古籍”的能力。2023年,合合信息针对现有的《西南彝志》、云南贵州一带古彝文字符开展统一编码,发布了古彝文基础编码数据库,实现AI“理解古籍”的突破。不仅如此,合合信息还将AI“看...
用科技守护文化根脉 传承千年文化瑰宝
现场展位开放了敦煌遗书合成样本的文字修复体验项目,公众可在不同位置移动扫描样本卷轴,见证AI如何通过字形修补、褪色修复、背景补全等方式,完成古籍的数字化修复。这并不是合合信息第一次通过先进的AI技术手段解决传统文化保护中的语言文字问题。2021年、2022年世界人工智能大会上,合合信息展现了智能文字识别技术在甲骨...
AI赋能 合合信息加速推动文化科技深度融合
AI赋能:从古文字识别到古籍修复传统文化传承新路径古籍是中华优秀传统文化的重要载体,将人工智能技术应用于古籍数字化建设,不仅实现了对中华文化瑰宝的精准识别、科学保存,也意味着古籍中承载的中华传统文化重焕新生,具备了在全球范围内广泛传播的技术基础。
斯坦福AI研究团队已正式道歉 涉嫌抄袭大模型已被撤下
面壁智能团队在6月2日深夜确认了这一事实,并指出斯坦福的模型不仅能识别出“清华简”中的战国古文字,而且连错误的识别结果都与MiniCPM模型完全一致(www.e993.com)2024年10月20日。这些古文字数据是面壁智能团队花费数月时间从清华简上逐字扫描并人工标注的,且从未公开过。这一事实证实了抄袭的事实,引发了广泛的关注和讨论。
识别古文字、修复老照片,AI让OCR玩出“新花样”|36氪专访
本次识别钟鼎文,是合合信息继去年在人工智能大会挑战识别甲骨文后追求的新挑战。合合信息扫描全能王事业部负责人曹超阳向36氪表示,古文的识别会涉及到OCR行业两大典型难点——图像优化处理与文字准确识别。图像优化处理方面,古文字的载体与常规平面差异较大。甲骨文与钟鼎文对应的载体是龟壳和青铜器,表面存在不同...
古文字“天书”不再艰涩难懂 华东师大发布智能文字识别系统
使用“商周金文智能镜”,艰涩难懂的“天书”商周金文就能为大众读懂使用,一般民众可以瞬间获得金文专家才具备的商周金文知识系统……今天上午,华东师范大学中国文字研究与应用中心发布AI+表意文字大数据成果——“文镜万象”出土文献智能识别释读系统之“商周金文智能镜”。
...大学发布业内首个古彝文编码“大字典” ,为古文字打造“身份证”
文字是文化的重要载体,古彝文承载了深远的彝族历史内涵,蕴含着丰富的文化信息。近期,合合信息联合上海大学、华南理工大学发布业内首个古彝文基础编码数据库,该项目由合合信息与上海大学社会学院、华南理工大学文档图像分析识别与理解实验室共同推进,针对现有的《西南彝志》、云贵一带字符,以智能图像处理、智能文字识别等...
古文字有了“身份证”!合合信息、上海大学、华南理工大学联合发布...
作为世界上最古老的文字之一,古彝文是中华文明地图上神秘而耀眼的印记。合合信息联合上海大学、华南理工大学团队针对现有的《西南彝志》、云贵一带古彝文字符开展统一编码,并于近期发布了业内首个古彝文基础编码数据库(简称“数据库”)。古彝文典籍编码、识别过程...