中国电信申请文本检索匹配专利,解决技术问题提升文本检索匹配性能
专利摘要显示,本申请公开了一种文本检索匹配方法、装置、存储介质和计算机程序产品。其中,该方法包括:获取第一搜索请求文本,并提取第一搜索请求文本的主题词;从预设的数据库内多个文本内获取与主题词相同的至少一个备选文本;利用预设的目标语言模型对第一搜索请求文本和各个备选文本进行特征提取,得到第一搜索请求文本对...
基于自然语言处理技术的中国氢能政策数据挖掘研究
多位学者均应用了自然语言处理技术对金融、旅游、创新等领域的政策开展政策主题、高频主题词、语句语义分析等方面研究。自然语言处理是一门融语言学、计算机科学、数学等多学科为一体的交叉学科,对分散化政策信息的量化研究具有普适性,具有信息抽取、数据处理、文本挖掘等方面的优势。本文搜集整理621份国家和地方政府发布...
保姆级教程: 如何撰写一篇SCI综述
一篇好的综述是总结、综合和批评某一个主题的文献。综述可以是描述性的:提供一个主题或领域的概述,类似于课本的章节;也可以是评估性的:分析许多来源的数据,以回答研究的问题;或者介于两组之间。以下主要从先检索,后定题;先定题,后检索;最终选题:定义目的,受众和范围;收集文献:文献检索和下载;写作前的准备工作;...
走近李生教授:培养出周明、王海峰等数位AI科学家,NLP国际最高奖项...
自动标引,就是利用计算机从情报和文献中自动抽取检索标志。主题词自动标引,就是自动抽取可以代表情报和文献内容的关键词。这一年,李生42岁。在北京,周明认识了中国科学院科学考察委员会的吴蔚天研究员(后来吴老师加入了中国软件技术公司语言工程部)。吴蔚天老师是理工科背景出身,特别喜欢自然语言处理。那时候吴老师也...
蒋清华等 | 宪法宣传教育四十载缩影:《人民日报》(1982—2022年...
形式是指独立于文本内容而存在的结构化程度较高的外部要素,例如文件的生成时间、制发主体、主题词(关键词)、报刊开设的版类和栏目等,这些要素都具有形式性,如果对大量文本的这些外部要素进行考察,就可得到一些规律性现象和结论。其二,“发现了什么”即研究逻辑,也涉及两个维度:描述性分析,回答“是什么”;因果性...
主题词和主题检索语言的类型有哪些?
主题词有多种表现形式,具体有标题词、叙词、单元词和关键词,它们所对应的检索语言是标题词语言、叙词语言、单元词语言和关键词语言(www.e993.com)2024年11月19日。(1)标题词和标题词语言标题词是指从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。标题词语言是先组式语言,它是通过主标题词和副标题词固定组配来构成检索标...
干货:常用的医学文献检索语言
《医学主题词》(medicalsubjectheadings,简称MeSH)是美国国立医学图书馆(NLM)编制的世界医学领域最权威、最常用的一部规范化的、可扩充的动态叙词表。MeSH是多功能的,NLM不仅用它作为生物医学文献标引的依据,编制MEDLINE/PubMed及其他多种检索数据库还用于图书及视听资料编目。另外,世界上很多检索系统也使用...
全军军用信息检索语言编管工作会议召开
全军军用信息检索语言编制管理委员会的前身是中央军委于1987年成立的“全军军用主题词表编制委员会”,2011年5月更名为全军军用信息检索语言编制管理委员会,主要负责全军军用信息检索语言编制、管理、应用和理论科研工作,统一规范我军军用信息检索语言。近年来,我军信息检索语言事业有了长足进步,取得《军用主题词表》等60多...
关于公文主题词的几个问题
是公文主题词表中表达公文的一定概念的最小词汇单元,是标引公文主题内容和形式的最基本要素。用于为按主题检索公文提供检索标识,为以现代信息处理手段管理公文奠定基础。二、公文主题词的确定公文主题词有其内在的本质要求:公文主题词必须是从自然语言中优选出来的,经过规范化处理的词汇。所谓“优选”是指根据实际...
赵建华为军用信息检索事业做出贡献
他所说的“门牌号码”,就是信息检索语言。赵建华与他领导的全军军用主题词表编管会办公室,就是用信息存储和检索的规范用语,在茫茫信息海洋“导航”,帮助你一路顺风,准确找到知识瑰宝的人。■“没有科学规范的信息检索语言工具,信息化建设的大厦就根基不稳”...