ECCV 2022 Oral | 理解艺术字:用于场景文字识别的角点引导...
2022年8月22日 - 网易
3.图像级的全局特征:由于全局特征对文字识别任务至关重要,模型可以从上下文视觉和语义信息中推理出当前字符,因此本文引入Transformer模型建模艺术字图像的全局特征。三、方法简述给定一张图像,首先利用一个角点检测器生成一张角点图,然后分别送入两层卷积网络得到初级特征。一方面,图像的特征将通过多头自注意力机制进一步...
详情
3.图像级的全局特征:由于全局特征对文字识别任务至关重要,模型可以从上下文视觉和语义信息中推理出当前字符,因此本文引入Transformer模型建模艺术字图像的全局特征。三、方法简述给定一张图像,首先利用一个角点检测器生成一张角点图,然后分别送入两层卷积网络得到初级特征。一方面,图像的特征将通过多头自注意力机制进一步...