[发明专利]一种提取文本字段的方法、装置及电子设备在审
申请号: | 202111428606.1 | 申请日: | 2021-11-29 |
公开(公告)号: | CN114202766A | 公开(公告)日: | 2022-03-18 |
发明(设计)人: | 徐书豪;金洪亮;闫凯;梅俊辉;王志刚;林文辉;高洁 | 申请(专利权)人: | 航天信息股份有限公司 |
主分类号: | G06V30/412 | 分类号: | G06V30/412;G06V30/414;G06V30/42;G06V30/146;G06V30/164;G06V30/19;G06N3/04 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 于丹 |
地址: | 100195 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 提取 文本 字段 方法 装置 电子设备 | ||
本申请公开一种提取文本字段的方法、装置及电子设备,该方法包括获取包含文本字段的原始图像,并在原始图像中确定出各个目标图像区域,然后对各个目标图像区域中的文本字段进行文本识别,得到各个目标图像区域对应的文本字段,再根据预设提取规则,从文本字段中提取出满足业务需求的目标文本字段。基于上述方法,实现对完税证明图像中的目标文本字段的提取,解决现有技术中无法针对完税证明图像中满足业务需求的目标文本字段进行提取的问题,有效提高提取目标文本字段的准确率。
技术领域
本申请涉及图像处理领域,尤其涉及一种提取文本字段的方法、装置及电 子设备。
背景技术
随着图像处理技术的发展,可以通过HOG(Histogram of Oriented Gradient, 方向梯度直方图)、LBP(Local Binary Patterns,局部二值模式)等图像处理技 术来识别完税证明这类证明图像中的文本字段。但这种方式具体为提取完税证 明图像中所有的文本字段,无法只针对完税证明图像中满足业务需求的目标文 本字段进行提取。
发明内容
本申请提供一种提取文本字段的方法、装置及电子设备,用以提取完税证 明图像中的目标文本字段,解决现有技术中无法针对完税证明图像中满足业务 需求的目标文本字段进行提取的问题,有效提高提取完税证明图像中的目标文 本字段的准确率。
第一方面,本申请提供了一种提取文本字段的方法,所述方法包括:
获取包含文本字段的原始图像,在所述原始图像中确定出各个目标图像区 域,其中,所述目标图像区域为所述待处理图像中包含所述文本字段的区域;
对所述各个目标图像区域中的文本字段进行文本识别,得到所述各个目标 图像区域对应的文本字段;
根据预设提取规则,从所述文本字段中提取出满足业务需求的目标文本字 段。
在一种可能的设计中,获取包含文本字段的原始图像,包括:获取包含文 本字段的待处理图像,将待处理图像按照预设角度进行旋转,得到与待处理图 像对应的不同旋转角度的N张旋转图像,然后将旋转图像中的文本字段投影在 给定方向上,并将旋转图像在给定方向上的投影进行叠加,得到旋转图像的投 影值,以此确定N张旋转图像对应的N个投影值,在这N个投影值中,选择 最小的投影值对应的旋转图像,将该旋转图像作为原始图像。
在一种可能的设计中,在获取包含文本字段的原始图像之后,还包括:将 原始图像划分为多个图像块,计算两个图像块之间的欧式距离,并将欧式距离 小于预设阈值的图像块确定为相似图像块,然后将相似图像块标识为相似区域, 得到原始图像中一个或多个相似区域,再对所述原始图像中的每个相似区域进 行去噪处理,得到经过所述去噪处理的原始图像。
在一种可能的设计中,在原始图像中确定出各个目标图像区域,包括:基 于目标检测模型,提取原始图像中的图像特征,然后根据图像特征,确定原始 图像中的各个目标图像区域。
在一种可能的设计中,根据预设提取规则,从文本字段中提取出满足业务 需求的目标文本字段,包括:基于预设数据库,获取目标文本字段与文本字段 之间的关联关系,然后根据所述关联关系,在原始图像中的文本字段中提取出 满足业务需求的目标文本字段。
在一种可能的设计中,在从文本字段中提取出满足业务需求的目标文本字 段之后,还包括:将目标文本字段发送至前端显示界面显示。
通过上述方法,实现对目标文本字段的提取,解决现有技术中无法针对完 税证明图像中满足业务需求的目标文本字段进行提取的问题,并且能够达到如 下技术效果:
1、通过对原始图像进行图像预处理的操作,基于对原始图像作角度纠正 与噪音过滤的处理,纠正原始图像使之处于设定状态,并且过滤原始图像中存 在的噪音像素,最大程度的还原该原始图像的图像信息,有利于提升确定原始 图像中各个目标图像区域的准确性;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于航天信息股份有限公司,未经航天信息股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111428606.1/2.html,转载请声明来源钻瓜专利网。