[发明专利]一种复杂文档图像倾斜校正方法在审
申请号: | 202111465849.2 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114140785A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 蒋荣;孙强;高明;苗功勋;熊英超;徐家伟;赖成宾 | 申请(专利权)人: | 南京中孚信息技术有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/26;G06V10/28;G06V10/30;G06V30/10;G06V10/24 |
代理公司: | 北京哌智科创知识产权代理事务所(普通合伙) 11745 | 代理人: | 陈培生 |
地址: | 210000 江苏省南京市浦口区江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 文档 图像 倾斜 校正 方法 | ||
本发明公开了文档图像倾斜校正技术领域的一种复杂文档图像倾斜校正方法,该方法的具体步骤为:S1:文本区域提取;S2:文字连通域筛选;S3:文本行提取;S4:校正图像;本发明支持复杂文档图像,通过文本区域提取,去除了文档图像中的复杂内容干扰,提高方法的鲁棒性;通过文字连通域筛选,进一步去除文档图像中可能存在的线段以及噪声点,并且根据文档图像中存在相同大小文字的先验知识,计算文字连通域最小外接矩形面积聚集点,据此得到有效的文字区域,提高算法精度;通过文本行方向探索以及逐渐扩张方法,降低文本行扩张出错的概率,最后筛选出置信度最高的文本行以计算文档倾斜角度,保证校正方法的精度。
技术领域
本发明涉及文档图像倾斜校正技术领域,具体为一种复杂文档图像倾斜校正方法。
背景技术
对文档图像进行内容分析时,通常使用光学字符识别算法进行文字内容提取,文档图像的成像质量对后续的字符识别算法的精度有着重大影响,其中文本的倾斜角度便是关键的因素之一,因此,通过预处理方法对文档图像进行倾斜校正,可以有效的提升字符识别精度,同时在面对包含自然场景或者人像的复杂文档图像中,具有鲁棒性的算法尤为重要。
基于此,本发明设计了一种复杂文档图像倾斜校正方法,以解决上述问题。
发明内容
本发明的目的在于提供一种复杂文档图像倾斜校正方法,以解决上述背景技术中提出的问题。
为实现上述目的,本发明提供如下技术方案:一种复杂文档图像倾斜校正方法,该方法的具体步骤为:
S1:文本区域提取;将复杂的文档图像包含的多种内容中的文本区域与其他图像区域区分开来,提高算法的精度以及鲁棒性;
S2:文字连通域筛选;通过所述S1中得到的文本区域,进一步筛选出文字连通域,去除可能存在的表格线、页眉页脚等,减少背景元素带来的影响;
S3:文本行提取;根据所述S2中得到的文字连通域,进行文本行的链接,并通过迭代执行该方法,提取出所有文本行;
S4:校正图像;得到所述S3中图像的文本行数据之后,计算文本行倾斜角度,据此对文档图像进行旋转
作为本发明的进一步方案,所述S1中文本区域提取的具体方法为:
Y=0.299R+0.587G+0.114BS1-1:图像颜色模式转换;读取图像文件,检测图像通道数,如果图像为三通道彩色图,转换为单通道灰度图,转换公式为:
R、G、B;
Y式中为转换后的灰度图像素值,为三通道彩色图中红、绿、蓝通道像素值;
S1-2:图像去噪;使用双边高斯滤波器对图像存在的噪声进行去除,保留图像高频信息,针对文字区域与背景区域有强烈的像素值差异,防止文字特征在图像去噪中模糊,其公式表达为:
(i,j),(k,l);
(k,l)f(k,l)(i,j)g(i,j)S其中是像素点在图像中的坐标,是设定的局部空间范围,
w(i,j,k,l)为滤波后点的像素值,为滤波前点的像素值;为权重系数,该系数由空间域位置临近系数以及值域相似性相乘得到,从而达到保留高频信息的效果,其公式表达为:
其中与表示是调节参数,用于调整空间域与值域的权重占比;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中孚信息技术有限公司,未经南京中孚信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111465849.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序