[发明专利]文档图像处理方法、文档图像处理装置及存储介质有效
申请号: | 201810294456.1 | 申请日: | 2018-03-30 |
公开(公告)号: | CN110321887B | 公开(公告)日: | 2023-09-19 |
发明(设计)人: | 李娇凤;罗兆海 | 申请(专利权)人: | 佳能株式会社 |
主分类号: | G06V30/148 | 分类号: | G06V30/148;G06V30/40 |
代理公司: | 北京怡丰知识产权代理有限公司 11293 | 代理人: | 迟军;李艳丽 |
地址: | 日本国东京都*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 文档 图像 处理 方法 装置 存储 介质 | ||
本发明提供一种文档图像处理方法、文档图像处理装置及存储介质。所述文档图像中包括与线接触的文本行,所述文档图像处理方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。
技术领域
本发明涉及一种文档图像处理技术,尤其涉及一种将文档图像中的文本行和与之相接触的线分离的技术。
背景技术
针对电子文档的处理获得了日益广泛的关注并在多个领域广泛应用,在电子文档处理技术中,诸如OCR(光学字符识别)等的文档图像识别技术在不同类型的设备中得到了大量的应用。例如,在包括扫描仪的MFP(多功能外围设备)中应用文档图像识别技术,或是在照相机、智能手机等设备中应用文档图像识别技术。
通常,将印刷有文字的书本、纸张等通过扫描仪的扫描或照相机的拍摄后生成的电子文档称为文档图像(Document Image),在文档图像中,可能存在文本行与线相接触(像素点的重叠、叠加)的情况。图1(a)示出了文档图像中的文本行和下划线相接触的示意图。除了图1(a)所示的下划线以外,还可能存在文本行与表格线、删除线等其他线相接触的情况。
为了将文档图像中的文本行和与之相接触的线分离开,提出了一种从文档图像中去除与文本行相接触的线的技术。首先,对图1(a)所示的文档图像进行诸如倾斜校正、去噪等预处理,得到图1(b)所示的预处理后的文档图像。接着,利用霍夫变换等方式检测出图1(b)中的水平线,即要被去除的下划线。最后,基于检测出的水平线的宽度(图1(b)中所示的水平线在Y轴方向上的像素点的数量),去除检测出的水平线,同时利用形态学的闭合操作,将去除水平线时可能断开的文本行中的各字符的笔画连接起来,得到图1(c)中所示的去除了下划线但保持了字符笔画的结果。
图1(a)所示的文档图像中的内容虽然存在诸如倾斜等线性变形,但通过倾斜校正等预处理手段可对线性变形进行校正,使得校正后的字符和线都处于水平或垂直方向,因而可通过去除直线状态的下划线来达到去除线的目的。但是,在利用扫描仪或照相机获得文档图像时,被扫描或被拍摄的书本/纸张可能是有一定厚度且不平的,因此,得到的文档图像中的内容可能存在图2所示的非线性变形。在此情况下,如果仍使用上述针对线性变形的线去除方式来去除非线性变形的线的话,是无法得到较好的线去除结果的。
发明内容
本发明旨在提供一种能够针对非线性变形的文档图像,去除其中与文本行相接触的线的方案,以实现在非线性状态下去除与文本行接触的线的目的。
根据本发明的一个方面,提供了一种文档图像处理方法,所述文档图像中包括与线接触的文本行,所述文档图像处理方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。
根据本发明的另一个方面,提供了一种文档图像处理装置,该装置所处理的文档图像中包括与线接触的文本行,所述文档图像处理装置包括:子区域划分单元,其被构造为:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;文本方向确定单元,其被构造为:根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;线确定单元,其被构造为:利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。
根据本发明的另一个方面,提供了一种存储指令的非暂时性计算机可读存储介质,所述指令在由计算机执行时使所述计算机进行文档图像处理方法,所述文档图像中包括与线接触的文本行,所述方法包括:将待处理文本行划分为多个子区域,其中,每个划分出的子区域中包含文本行中的部分字符和与字符接触的线;根据子区域中包含的字符和与字符接触的线的方向来确定该子区域的文本方向;利用确定出的子区域的文本方向来确定待处理文本行中与文本行接触的线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于佳能株式会社,未经佳能株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810294456.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序