千余部古籍文献“入脑” 形成高质量中药知识图谱 中西医结合“数...
它的“大脑”装下海量知识库,数据基础以《黄帝内经》《伤寒杂病论》等著名中医典籍及1000多本古籍和中医药文献为核心,形成高质量的中药知识图谱,涵盖超过9000种中药材、超过4万种中药成分、超过1.8万种靶点、超过2000种疾病等,基于这些结构化及非结构化数据构建起1000万个节点及3.2亿个关系对。在研发过程中,该大...
北疆文化古籍资源库平台正式发布
据了解,“北疆文化古籍资源库平台”是以民族古籍文献综合管理、多语种古籍OCR、古籍文献全文检索、民族古籍文献智能分析、民族古籍文献大数据可视化、古籍文献图像修复和民族古籍文献知识图谱等系统为一体的大型融合平台。内蒙古大学联合内蒙古社会科学院启动了蒙古文古籍文献的数字化和相关智能平台的建设工作,主持开展了内蒙...
上新|中国古籍图典资源库:从10万张古籍图像中品味典籍之美
我们从《庆赏升平》《本草图谱》《皇朝礼器图式》《西清古鉴》《花鸟图》《永乐大典》门字卷的图片中提取一千余个精选纹样进行矢量化绘制和加工。国家图书馆出版社对已上线纹样拥有完全知识产权。“中国古籍图典资源库”中的纹样素材,以来源书为类别进行展示,使用者可在纹样详情页下载纹样矢量图或直接跳转至原图,方...
从纸页“搬”到网页 数字化让古籍“活”起来
比如,在数字技术的“加持”下,通过古籍数字化工作的推进,将更多原始书影转化为便于借阅的微缩胶卷、便于检索的电子数据库、便于理解的知识图谱等,让古籍以新的形式延续生命、焕发光彩。一本古籍,如何从纸页“搬”到网页?2022年10月上线的“识典古籍”平台,做出了积极的探索尝试。该平台由北京大学与抖音合作共...
“识典古籍”平台上线智能助手,大模型助力提升古籍查阅效率
字节跳动依托在OCR(光学字符识别)、自然语言处理、知识图谱等技术领域的经验积累,以及互联网产品设计与研发优势,探索借助人工智能提高古籍修复、整理工作效率。当年10月,由该实验室研发的古籍数字化平台——“识典古籍”上线,收获了许多文史爱好者与研究者的正面反馈与支持。
年轻人+新技术 为古籍寻找新的“打开方式”
数字化、互联网、大数据和人工智能技术的发展,为青年人做古籍工作带来前所未有的便利:古籍在线录入和校对、AI自动句读与文本校勘等技术,颠覆了传统古籍整理的实践,古籍全文检索、文本挖掘与标记、知识图谱与循证等,必将极大地改变古籍的研究方法和路径(www.e993.com)2024年7月31日。借助现代数字技术,厚重典籍浓缩在方寸之间,尘封已久的历史画卷徐徐...
喜报!汉王数字中标国家图书馆中华古籍智慧化服务平台系统
中华古籍智慧化服务平台系统项目,是以国家图书馆和地方图书馆的数字化古籍为基础,利用AI技术进行文字识别、自动标点、命名实体识别、知识图谱构建等任务,实现古籍资源的知识处理、知识组织及知识展示,形成古籍知识词表,并建设中华古籍书目总目,为社会公众、古籍学界及科研人员提供数字人文服务。
千余部古籍文献入脑 4万中医成分开药方 中西医结合“数智岐黄”大...
它的“大脑”装下海量知识库,其数据基础以《黄帝内经》、《伤寒杂病论》等著名中医典籍及1000多本古籍和中医药文献为核心,形成高质量的中药知识图谱,涵盖超过9000种中药材、超过4万种中药成分、超过1.8万种靶点、超过2000种疾病等,基于这些结构化及非结构化数据构建起1000万个节点及3.2亿个关系对。
40亿数据灌注国内首个古籍处理与研究开源智能工具
“对于汉语言研究者来说,他们还可以利用‘荀子’完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等工作。”王东波举例,如果要研究《史记·陈涉世家》的人物关系,就可以用“荀子”识别这篇文章中的人物名称和关系名词,再用知识图谱的方式呈现人物关系图谱,从而提高检索、查询、研究的效率。
“古籍版ChatGPT”——荀子古籍大语言模型面世
“对于汉语言研究者来说,他们还可以利用‘荀子’完成古籍词法分析、实体识别、关系抽取、文本分类与匹配、文本摘要等工作。”王东波举例,如果要研究《史记·陈涉世家》的人物关系,就可以用大模型识别这篇文章中的人物名称和关系名词,再用知识图谱的方式呈现人物关系图谱,从而提高检索、查询、研究的效率。