[发明专利]一种复杂文档图像倾斜校正方法在审
申请号: | 202111465849.2 | 申请日: | 2021-12-03 |
公开(公告)号: | CN114140785A | 公开(公告)日: | 2022-03-04 |
发明(设计)人: | 蒋荣;孙强;高明;苗功勋;熊英超;徐家伟;赖成宾 | 申请(专利权)人: | 南京中孚信息技术有限公司 |
主分类号: | G06V20/62 | 分类号: | G06V20/62;G06V10/26;G06V10/28;G06V10/30;G06V30/10;G06V10/24 |
代理公司: | 北京哌智科创知识产权代理事务所(普通合伙) 11745 | 代理人: | 陈培生 |
地址: | 210000 江苏省南京市浦口区江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 复杂 文档 图像 倾斜 校正 方法 | ||
1.一种复杂文档图像倾斜校正方法,其特征在于:该方法的具体步骤为:
S1:文本区域提取;将复杂的文档图像包含的多种内容中的文本区域与其他图像区域区分开来,提高算法的精度以及鲁棒性;
S2:文字连通域筛选;通过所述S1中得到的文本区域,进一步筛选出文字连通域,去除可能存在的表格线、页眉页脚等,减少背景元素带来的影响;
S3:文本行提取;根据所述S2中得到的文字连通域,进行文本行的链接,并通过迭代执行该方法,提取出所有文本行;
S4:校正图像;得到所述S3中图像的文本行数据之后,计算文本行倾斜角度,据此对文档图像进行旋转。
2.根据权利要求1所述的一种复杂文档图像倾斜校正方法,其特征在于:所述S1中文本区域提取的具体方法为:
Y=0.299R+0.587G+0.114BS1-1:图像颜色模式转换;读取图像文件,检测图像通道数,如果图像为三通道彩色图,转换为单通道灰度图,转换公式为:
R、G、B;
Y式中为转换后的灰度图像素值,为三通道彩色图中红、绿、蓝通道像素值;
S1-2:图像去噪;使用双边高斯滤波器对图像存在的噪声进行去除,保留图像高频信息,针对文字区域与背景区域有强烈的像素值差异,防止文字特征在图像去噪中模糊,其公式表达为:
(k,l)f(k,l)(i,j)g(i,j)S其中是像素点在图像中的坐标,是设定的局部空间范围,
w(i,j,k,l)为滤波后点的像素值,为滤波前点的像素值;为权重系数,该系数由空间域位置临近系数以及值域相似性相乘得到,从而达到保留高频信息的效果,其公式表达为:
其中与表示是调节参数,用于调整空间域与值域的权重占比;
tvtvtvtbS1-3:文本区域计算;方差通常用于判断数据的变动范围,通过分析文档图像发现,文本区域的局部方差与复杂的自然影像之间局部方差有较大区别,据此计算图像的局部方差图,为了降低文档背景色对方差图计算的影响,根据先验知识设定背景颜色阈值,高于阈值的像素将在方差图计算中被忽略;设定方差阈值,将局部方差图中大于的像素置为0,小于的像素值为1,得到文本区域的掩模图;根据得到的文本区域掩膜,与所述S1-2处理后的文档图像进行像素相乘操作,提取文档图像中的文本区域图像,可以有效减少文档图像中其他元素的干扰。
3.根据权利要求2所述的一种复杂文档图像倾斜校正方法,其特征在于:所述S2中文字连通域筛选的具体方法为:
tmaxS2-1:文本区域二值化;通过使用局部二值化算法对文本区域进行二值化计算,减少文档图像收集时的光照不均匀影响;
tmintmaxtminS2-2:文字连通域初次筛选;根据先验知识,设定连通域面积阈值以及连通域面积阈值,对所述S2-1中得到的二值化图进行连通域分析,面积大于或小于认为噪声区域,本方法设定二次筛选,所以对初筛的先验知识要求较低,避免降低算法的鲁棒性;
biiBnamax+1aminamaxaminS2-3:文字连通域二次筛选;分析文档图像特征,其中同等大小的文字普遍存在,据此根据连通域最小外接矩形对连通域进行排序,得最小矩形面积,最大矩形面积,据此以,为界限,设定个桶:
B={n1,n2,n3...bn},其中第个桶的面积区间为:
根据每个桶的区间范围,将最小外接矩形面积属于该范围的连通域放入其中,最后我们取连通域个数最多的桶,作为文本连通域密集范围,并将该ri桶内所有连通域认定为文字区域,如果存在多个桶都为最大值,则取多个桶内的连通域为文字。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京中孚信息技术有限公司,未经南京中孚信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111465849.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序