“识典古籍”测试版正式上线 古籍要走向活化、大众化
文字识别技术,是对古籍的影印版文字进行单个切分、文字识别、顺序识别。自动标点技术,是通过序列标注的方式对古籍自动进行标点划分。命名实体识别,则是通过序列标注识别古籍文本中的命名实体,支持识别人名、地名、书籍、时间、官职等信息。目前,行业内OCR识别准确率平均为93%至94%,“识典古籍”的准确率为96%至97%。
专家谈藏文古籍保护与数字化:让历史“活”起来、“火”起来
中国藏文古籍目录编制与分类法研究起步早,成果颇丰,但也面临多种分类法长期并存的局面。为此,扎西次仁建议整合出统筹兼顾的归一化藏文古籍分类法,并提出草案,以使用户查找数据、跨单位古籍文献共建共享更加便利。在她看来,加强藏文古籍数字资源共建共享,一方面需要规范藏文古籍数字化从古籍扫描、著录规范到OCR识别校准...
内蒙古建成北疆文化古籍资源库平台
????3月31日,由内蒙古大学和内蒙古社会科学院联合研发的北疆文化古籍资源库平台发布,该平台是目前国内外数字化存储蒙古文古籍文献最多、检索分析智能化程度最高的古籍资源库。????北疆文化古籍资源库平台实现数字化蒙古文古籍11291卷(册)、116.3万张古籍图像,建立了24万条古籍文献知识图谱三元组,并着眼于铸牢...
喜报!汉王数字中标国家图书馆中华古籍智慧化服务平台系统
汉王将通过自研的OCR、天地大模型等AI技术,对影像的文字、表格、版式等识别,实现古籍自动句读、命名实体自动标注、繁简自动转换和翻译等知识处理,完成古籍知识抽取、知识融合、知识服务等古籍知识库建设,为全国提供古籍数据展示、导航、检索和推荐、关联等智慧化服务。在本次中标项目中,汉王将进一步探索大模型等生成式AI...
“识典古籍”邂逅人工智能 古籍走入“寻常百姓家”
基于在OCR(文字识别技术)、自然语言处理、知识图谱等技术领域的积累,以及互联网产品设计与研发优势,研发团队很快对古籍智能助手有了初步的设想:打造一款能够帮助用户检索、阅读,甚至深入挖掘古籍知识的工具。然而,古籍智能助手只是一个具有实验性的新事物,当初的期待想要落地还需要长久地摸索。研发团队首先想到的是...
“识典古籍”平台上线智能助手,大模型助力提升古籍查阅效率
字节跳动依托在OCR(光学字符识别)、自然语言处理、知识图谱等技术领域的经验积累,以及互联网产品设计与研发优势,探索借助人工智能提高古籍修复、整理工作效率(www.e993.com)2024年10月20日。当年10月,由该实验室研发的古籍数字化平台——“识典古籍”上线,收获了许多文史爱好者与研究者的正面反馈与支持。
让更多古籍“活”起来
2022年10月,由“北京大学—字节跳动数字人文开放实验室”研发的古籍数字化平台“识典古籍”上线,通过OCR校对校勘、自动标点、实体识别、自动翻译等技术的整合,如今已实现了2000多部古籍的电子化和可视化。作为一款文化公益产品,“识典古籍”平台为公众提供免费阅读和利用古籍的便利。北京大学人工智能研究院副研究员、...
荀子古籍大语言模型发布会举办
12月2日,南京农业大学国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究”课题组的荀子古籍大语言模型发布会暨古籍智能化研究与产业应用研讨会,在古联(北京)数字传媒科技有限公司举办。荀子古籍大语言模型是由南京农业大学王东波教授为首席专家的国家社科基金重大项目“中国古代典籍跨语言知识库构建及应用研究...
北疆文化古籍资源库平台正式发布
3月31日,由内蒙古大学和自治区社会科学院联合研发的北疆文化古籍资源库平台在内蒙古大学正式发布。“北疆文化古籍资源库平台”是以民族古籍文献综合管理、多语种古籍OCR、古籍文献全文检索、民族古籍文献智能分析、民族古籍文献大数据可视化、古籍文献图像修复和民族古籍文献知识图谱等系统为一体的大型融合平台。内蒙古大学联...
数字化助力古籍保护与传承 让古籍焕发活力新生
杨浩介绍了番茄小说所引入的“识典古籍”阅读平台,指出,通过OCR校对校勘、自动标点、实体识别、自动翻译等技术的整合,目前已有2000多部古籍实现了电子化和可视化,并登录番茄小说阅读平台,作为一种文化公益产品,提供免费阅读和利用。杨浩认为,在数字环境下,平台及可视化技术助力人文学科打造基础信息设施,对于智能时代...