[发明专利]一种纸质文本图像处理方法、装置及电子设备有效
申请号: | 202111065828.1 | 申请日: | 2021-09-10 |
公开(公告)号: | CN113784009B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 郭彦军;郝志军;刘子强 | 申请(专利权)人: | 北京航星永志科技有限公司 |
主分类号: | H04N1/00 | 分类号: | H04N1/00;H04N1/409;G06V30/413;G06V30/414 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 王娜 |
地址: | 102209 北京市昌平区七*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纸质 文本 图像 处理 方法 装置 电子设备 | ||
本发明公开了一种纸质文本图像处理方法、装置及电子设备,包括:获取纸质文本图像;对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息;根据所述定位框的坐标信息,对所述定位框内文本进行分类识别;当所述定位框内文本中的文本为反向文本,对识别到的反向文本响应清除操作。通过识别纸质文本图像将图像中的反向文本去除,使得转化后的文本更加清晰,提高了纸质文本数字化转换过程中的效率。
技术领域
本发明涉及图像识别技术领域,具体涉及一种纸质文本图像处理方法、装置及电子设备。
背景技术
随着互联网的发展,数字化的存储管理管理方法,可以显著提高存储、管理、检索等的效率及安全性。在纸质文件进行数字化转换的过程中,各种纸质文件的情况极其复杂,例如,有些纸质文件由于存放时间的久远,存在着纸张背面的信息可能会渗透到纸张的正面的问题,使得在纸张的正面形成反向文本。由于文件的数字化有着严格的标准,在数字化的过程中,需要花费大量的人力和时间保证纸质文件在数字化过程中的信息完整清晰,严重的影响数字化的效率。
发明内容
因此,本发明要解决的技术问题在于克服本纸质本间背面字体渗透到正面对数字化文本识别造成干扰的缺陷,从而提供一种纸质文本图像处理方法、装置及电子设备。
根据第一方面,本发明实施例公开了一种纸质文本图像处理方法,包括:获取纸质文本图像;对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息;根据所述定位框的坐标信息,对所述定位框内文本进行分类识别;当所述定位框内的文本为反向文本,对识别到的反向文本响应清除操作。
可选地,所述当所述文本信息中包含反向文本,对识别到的反向文本响应清除操作之后,所述方法还包括:对进行清除操作后的纸质文本图像进行高清处理,得到高清纸质文本图像;当所述纸质文本图像包含图片时,确定所述图片在所述高清纸质文本图像中的位置信息;根据所述位置信息,利用所述纸质文本图像中的图片替换所述高清纸质文本图像中的图片。
可选地,对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息之前,所述方法还包括:基于所述纸质文本图像进行纠偏和切边处理。
可选地,所述对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息,包括:对所述纸质文本图像进行缩小得到缩小后的纸质文本图像;对所述缩小后的纸质文本图像进行特征提取,得到特征图;对所述特征图进行滑动窗特征截取得到特征子图;基于所述特征子图得到所述纸质文本图像的特征向量,并根据所述特征向量得到所述文本的定位框坐标信息。
可选地,基于所述特征子图得到纸质文本图像的特征向量,包括:将所述特征子图输入到循环神经网络得到所述特征子图的序列特征;将所述特征子图的序列特征再次输入到循环神经网络进行还原操作得到还原后的特征子图;将所述还原后的特征子图输入到全连接层得到包含所有信息的特征向量。
可选地,当所述定位框内的文本为反向文本,对识别到的反向文本响应清除操作,包括:将满足目标条件的反向文本的定位框进行放大;对对放大后的定位框中的反向文本进行去除。
根据第二方面,本发明实施例还公开了一种纸质文本图像处理装置,包括:获取模块,用于获取纸质文本图像;识别模块,用于对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息;分类模块,用于根据所述定位框的坐标信息,对所述定位框内文本进行分类识别;清除模块,用于当所述定位框内的文本为反向文本,对识别到的反向文本响应清除操作。
可选地,所述装置还包括:高清处理模块,用于对进行清除操作后的纸质文本图像进行高清处理,得到高清纸质文本图像;定位模块,用于当所述纸质文本图像包含图片时,确定所述图片在所述高清纸质文本图像中的位置信息;替换模块,用于根据所述位置信息,利用所述纸质文本图像中的图片替换所述高清纸质文本图像中的图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航星永志科技有限公司,未经北京航星永志科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111065828.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序