品茗科技申请文本数据相似度确定方法和系统专利,提高了相似度确定方法的效率

2024-06-18 11:05:21 - 金融界网站

转自:金融界

本文源自:金融界

金融界2024年6月18日消息,天眼查知识产权信息显示,品茗科技股份有限公司申请一项名为“文本数据相似度确定方法和系统“,公开号CN202410621036.5,申请日期为2024年5月。

专利摘要显示,本申请涉及一种文本数据相似度确定方法,该方法包括:分别对第一文本和第二文本中的同类型字段进行分词处理,得到各类型字段的第一词汇表和第二词汇表,以第一词汇表构建横轴,以第二词汇表构建纵轴,得到第一文本坐标系,在第一文本坐标系中,沿正方向逐一对第一词汇表和第二词汇表中的词汇进行语义比对,按照比对结果和预设文本转换规则,生成至少两条文本转换路径,在文本转换路径中,将转换操作次数最少的路径作为目标路径,基于目标路径确定第一文本和第二文本的相似度。通过本申请,解决了文本相似度确定方法效率低的问题。通过构建文本坐标系,获取文本转换的最少操作步骤,得到两个文本的相似度,提高了相似度确定方法的效率。

今日热搜