[发明专利]一种纸质文本图像处理方法、装置及电子设备有效
申请号: | 202111065828.1 | 申请日: | 2021-09-10 |
公开(公告)号: | CN113784009B | 公开(公告)日: | 2022-10-18 |
发明(设计)人: | 郭彦军;郝志军;刘子强 | 申请(专利权)人: | 北京航星永志科技有限公司 |
主分类号: | H04N1/00 | 分类号: | H04N1/00;H04N1/409;G06V30/413;G06V30/414 |
代理公司: | 北京三聚阳光知识产权代理有限公司 11250 | 代理人: | 王娜 |
地址: | 102209 北京市昌平区七*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 纸质 文本 图像 处理 方法 装置 电子设备 | ||
1.一种纸质文本图像处理方法,其特征在于,包括:
获取纸质文本图像;
对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息;
根据所述定位框的坐标信息,对所述定位框内文本进行分类识别;
当所述定位框内的文本为反向文本,对识别到的反向文本响应清除操作;
对进行清除操作后的纸质文本图像进行高清处理,得到高清纸质文本图像;
当所述纸质文本图像包含图片时,确定所述图片在所述高清纸质文本图像中的位置信息;
根据所述位置信息,利用所述纸质文本图像中的图片替换所述高清纸质文本图像中的图片。
2.根据权利要求1所述的方法,其特征在于,对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息之前,所述方法还包括:
基于所述纸质文本图像进行纠偏和切边处理。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息,包括:
对所述纸质文本图像进行缩小得到缩小后的纸质文本图像;
对所述缩小后的纸质文本图像进行特征提取,得到特征图;
对所述特征图进行滑动窗特征截取得到特征子图;
基于所述特征子图得到所述纸质文本图像的特征向量,并根据所述特征向量得到所述文本的定位框坐标信息。
4.根据权利要求3所述的方法,其特征在于,基于所述特征子图得到纸质文本图像的特征向量,包括:
将所述特征子图输入到循环神经网络得到所述特征子图的序列特征;
将所述特征子图的序列特征再次输入到循环神经网络进行还原操作得到还原后的特征子图;
将所述还原后的特征子图输入到全连接层得到包含所有信息的特征向量。
5.根据权利要求1所述的方法,其特征在于,当所述定位框内的文本为反向文本,对识别到的反向文本响应清除操作,包括:
将满足目标条件的反向文本的定位框进行放大;
对放大后的定位框中的反向文本进行去除。
6.一种纸质文本图像处理装置,其特征在于,包括:
获取模块,用于获取纸质文本图像;
识别模块,用于对所述纸质文本图像进行文本识别得到所述纸质文本图像中所包含的文本的定位框以及定位框的坐标信息;
分类模块,用于根据所述定位框的坐标信息,对所述定位框内文本进行分类识别;
清除模块,用于当所述定位框内的文本为反向文本,对识别到的反向文本响应清除操作;
高清处理模块,用于对进行清除操作后的纸质文本图像进行高清处理,得到高清纸质文本图像;
定位模块,用于当所述纸质文本图像包含图片时,确定所述图片在所述高清纸质文本图像中的位置信息;
替换模块,用于根据所述位置信息,利用所述纸质文本图像中的图片替换所述高清纸质文本图像中的图片。
7.一种电子设备,其特征在于,包括:至少一个处理器;以及与所述至少一个处理器通信连接的存储器;其中,所述存储器存储有可被所述至少一个处理器执行的指令,所述指令被所述至少一个处理器执行,以使所述至少一个处理器执行如权利要求1-5任一所述的纸质文本图像处理方法的步骤。
8.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-5中任一项所述的纸质文本图像处理方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航星永志科技有限公司,未经北京航星永志科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111065828.1/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序