第二批“数据要素×”典型案例集锦(上)
构建工程科技专家库、机构数据库、战略咨询资源库、学术会议资源库等8个主题库,基于知识组织与知识计算等前沿技术对咨询报告等资源深度加工,形成特色数据资源。三是实施全面的数据安全控制措施。依托知识中心的数据安全管理规范,对数据资源处理流程实行端到端的监控;依据数据资源的分类分级管理制度,实行差异化管理策略,对...
干货| 语言研究必备的37个常用语料库
BCC语料库是以汉语为主,兼有英语、西班牙语、法语、德语、土耳其语等语言的语料库,其中汉语语料规模约150亿字,涵盖了报刊、文学、微博、科技、综合和古汉语等多领域语料。BCC语料库包括了生语料、分词语料、词性标注语料和句法树,目前已对现代汉语、英语、法语的语料进行词性标注。网站地址:httpbcc.blcu.edu....
科研方法 | 超实用!37个国内常用语料库集锦,建议收藏
BCC语料库是以汉语为主,兼有英语、西班牙语、法语、德语、土耳其语等语言的语料库,其中汉语语料规模约150亿字,涵盖了报刊、文学、微博、科技、综合和古汉语等多领域语料。BCC语料库包括了生语料、分词语料、词性标注语料和句法树,目前已对现代汉语、英语、法语的语料进行词性标注。httpbcc.blcu.edu03....
干货|国内最常用的17个语料库
BCC语料库(httpbcc.blcu.edu)是以汉语为主,兼有英语、西班牙语、法语、德语、土耳其语等语言的语料库,其中汉语语料规模约150亿字,涵盖了报刊、文学、微博、科技、综合和古汉语等多领域语料。BCC语料库包括了生语料、分词语料、词性标注语料和句法树,目前已对现代汉语、英语、法语的语料进行词性标注。03...
史上最全解读|飞桨模型库重大升级,主流算法模型全覆盖
飞桨全景图,本文主要针对基础模型库部分进行深度解读。第一部分,首先看一下最新版本模型库的主要更新点。本次主要更新点1.1.PaddleCV发布训练部署端到端的图像分割库PaddleSeg,图像分类新增EfficientNet等43个预训练模型。PaddleDetection新增2019Objects365FullTrack冠军模型、BlazeFace等人脸检测小...
资源| 知网(HowNet)知识库的简单调用指南
以事件类为例,在中文中具有事件义原的汉字(单纯词)中曾提取出3200个义原(www.e993.com)2024年10月23日。但我们需要对重复义原进行合并,3200个事件义原在初步合并后可得到1700个,进一步归类后得到大约800多个义原。因为这些义原完全不涉及多音节的词语,所以我们需要将其作为标注集去标注多音节的词。最后我们需要对所有2800多个义原...