腾讯公司申请文档的识别方法、装置、设备、介质及产品专利,提高了对版面元素的感知能力,从而提升了泛化性能

2024-06-07 10:40:57 - 金融界网站

转自:金融界

本文源自:金融界

金融界2024年6月7日消息,天眼查知识产权信息显示,腾讯科技(深圳)有限公司申请一项名为“文档的识别方法、装置、设备、介质及产品“,公开号CN202410572461.X,申请日期为2024年5月。

专利摘要显示,本申请公开了一种文档的识别方法、装置、设备、介质及产品,涉及人工智能领域。该方法包括获取文档图像,文档图像被第一尺寸的滑动窗口划分为多个第一窗口区域,文档图像以第二尺寸划分为多个图像块;基于多个第一窗口区域内图像块间的语义关联度,确定所述多个图像块分别对应的第一特征表示;将第一尺寸的滑动窗口在文档图像上移动预设偏移量,将文档图像重新划分为多个第二窗口区域;基于多个第二窗口区域内第一特征表示间的语义关联度,确定多个图像块分别对应的第二特征表示;基于第二特征表示识别文档图像中的版面元素,得到文档图像对应的版面识别结果。该方法实现了多尺度特征的提取,提高了对版面元素的感知能力,从而提升了泛化性能。

今日热搜