中国电信申请文本检索匹配专利,解决技术问题提升文本检索匹配性能
专利摘要显示,本申请公开了一种文本检索匹配方法、装置、存储介质和计算机程序产品。其中,该方法包括:获取第一搜索请求文本,并提取第一搜索请求文本的主题词;从预设的数据库内多个文本内获取与主题词相同的至少一个备选文本;利用预设的目标语言模型对第一搜索请求文本和各个备选文本进行特征提取,得到第一搜索请求文本对...
文献检索:论文写作的基石
1.文献外部特征:如篇名、作者、出版单位、报告号等,可以作为检索的直接依据。2.文献内部特征:包括分类途径、主题途径等。分类途径可以通过目次、分类表等进行检索,而主题途径则可利用主题词和关键词索引。3.其他检索途径:如分子式索引和生物分类索引等,这些特殊途径有助于细化检索结果。五、实施检索操作与获取文...
基于自然语言处理技术的中国氢能政策数据挖掘研究
将高频主题词与氢能产业链各环节主要发展方向进行关联归类,确定氢能产业链核心主题词15类,其中,制氢环节核心主题词为“可再生能源制氢”、“工业副产氢”和“化石能源制氢”,储氢环节核心主题词为“液态”“固态”和“气态”,输氢环节核心主题词为“管道”和“拖车”,用氢环节核心主题词为“交通”“电力...
省府办公厅印发《国务院公文主题词表》 广东省人民政府门户网站
(二)词表体现文档管理一体化的原则,即词表中主题词的区域分类和类别词可分别做为档案分类中的大类和属类。二、体系结构(一)词表共由15类1049个主题词组成,分为主表和附表两大部分,主表有13类751个主题词,附表有2类298个主题词。词表分为三个层次。第一层是对主题词区域的分类,如“综合经济”、“财政...
保姆级教程: 如何撰写一篇SCI综述
(1)检索文献:文献综述写作时,我们要以「查全」为目的。在PubMed上检索文献时,随便搜搜是不可行的,需要结合「自由词」和「主题词」去检索。为什么要用主题词检索?主题词,是将不同文献的表达方式归引到经过人工规范后的词汇。检索这样的主题词,就能解决文章词汇表达不同的问题。
【大比武10】行业垂直大模型应用在档案管理中的探索
通用大模型通常指的是能够处理各种领域和主题的大型语言模型,例如ChatGPT和Llama3(www.e993.com)2024年11月19日。通用大模型在多个领域具有广泛的知识和能力,具备能够回答各种问题、提供多领域的信息与支持、自动编程等能力。而行业垂直大模型是指针对特定行业或领域进行微调训练的大型语言模型,这些模型会基于特定行业的数据和应用场景进行微调,以提供...
主题词和主题检索语言的类型有哪些?
主题词有多种表现形式,具体有标题词、叙词、单元词和关键词,它们所对应的检索语言是标题词语言、叙词语言、单元词语言和关键词语言。(1)标题词和标题词语言标题词是指从自然语言中选取并经过规范化处理,表示事物概念的词、词组或短语。标题词语言是先组式语言,它是通过主标题词和副标题词固定组配来构成检索标...
PubMed 检索如何查全?教你 MeSH 主题词+自由词大法!
图片来源:PubMed检索结果页第一步:建立MeSH主题词!进入PubMed官网后,先往下拉,找到「MeSHDatabase」,点进去后输入关键词「"Transcranialmagneticstimulation"」,再点击「Search」后就能得到我们需要的主题词、副主题词以及自由词。图片来源:PubMed检索结果页...
干货:常用的医学文献检索语言
《医学主题词》(medicalsubjectheadings,简称MeSH)是美国国立医学图书馆(NLM)编制的世界医学领域最权威、最常用的一部规范化的、可扩充的动态叙词表。MeSH是多功能的,NLM不仅用它作为生物医学文献标引的依据,编制MEDLINE/PubMed及其他多种检索数据库还用于图书及视听资料编目。另外,世界上很多检索系统也使用...
语言蕴含情感——积极的话语同样是一剂良药
现代语言学中,主题词是一个模糊概念,需要通过语料库的方法进行提取,但微博的主题却是明确的,作者以两个#号标出。明确的主题可以帮读者找出话语轨迹,挖掘博文中隐藏的知识及体裁特征,更好地解读博文的隐含信息。在本次抓取的45345条博文中,22566条含有两个或两个以上的主题。读者在阅读关于主题一的博文时可以点击...