[发明专利]一种基于投影算子的古籍文档图像处理算法在审
申请号: | 201310221753.0 | 申请日: | 2013-06-06 |
公开(公告)号: | CN104239880A | 公开(公告)日: | 2014-12-24 |
发明(设计)人: | 姚志英;曹海青 | 申请(专利权)人: | 北京物资学院 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06T7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 101149 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 投影 算子 古籍 文档 图像 处理 算法 | ||
1.一种基于投影算子的古籍文档图像处理算法,其特征在于:该算法所设计的投影算子包括水平投影算子H和垂直投影算子V,其中水平投影算子H是指对图像颜色信息按列进行求和;垂直投影算子V是指对图像的颜色信息按行进行求和。
2.根据权利要求1所述的一种基于投影算子的古籍文档图像处理算法,其特征在于:该算法可以根据古籍文档的内容和结构对古籍文档的灰度图像进行区域划分,对各个子区域利用投影算子求出各区域的灰度均值作为该区域二值化的阈值,对各子区域进行二值化,实现对整个古籍文档灰度图像的二值化;经工程验证这种基于投影算子的灰度图像二值化法方法可有效抑制图像内容不均匀、局部破损和边框等对图像二值化的影响。
3.根据权利要求1所述的一种投影算子的古籍文档图像处理算法,其特征在于:可通过投影算子实现古籍文档图像的边框检测,其检测流程如图1所示,具体检测步骤依次如下:
(1)对图像采集设备采集到的大小尺寸为W×L的古籍文档彩色图像进行二值化处理,得到古籍文档的二值化图;
(2)根据二值化图的内容,生成图像内容矩阵CW×L,其中C[i][j]=0或C[i][j]=1;
(3)对二值化图进行水平投影,即求矩阵CW×L每一列元素的和构成数组
(4)求出从0到[W/4]和从[3W/4]+1到W-1的最大值Sc1[j1]和最大值Sc1[j2],则j1和j2就是古籍文档图像边框所在的列;求出从0到[L/4]和从[3L/4]+1到L-1的最大值Srw[i1]和最大值Srw[i2],则i1和i2就是古籍文档图像边框所在的行;通过上述处理即可实现古籍文档的边框检测。
4.根据权利要求1所述的一种基于投影算子的古籍文档图像处理算法,其特征 在于:可通过投影算子实现古籍文档图像的污点检测,设所要检测的污点面积A,且A1≤A≤A2,其检测流程如图2所示,具体检测步骤依次如下:
(1)分析数组Srw的内容,若Srw[i]≠0,则产生可能有污点的行信息数组DataRow[k]=i;
(2)对可能出现污点的行i所在二值化图像信息按列进行分析,若C[k][j]≠0,则将j作为污点的起始列,如果可能出现污点的列信息相差为1,就将两污点连为线段,将线段的起点作为污点矩形起点的横坐标,线段终点(列)作为污点矩形终点的横坐标,将当前的行数作为污点矩形起点和终点的纵坐标;
(3)依据污点行信息数组DataRow中数据,对古籍文档二值图内容重复(2)所做的分析,并判断所产生的线段之间的关系,如果当前行DataRow[k]中线段位置(列信息)和上一行DataRow[k-1]中线段位置(列信息)重复时,将污点矩形的起点纵坐标更改为上一行的行序号DataRow[k-1],这样通过分析二值化图的垂直投影和二值化图的内容即可快速地检测出可能存在污点的矩形位置及大小。
(4)如果所得污点矩形面积A满足A1≤A≤A2,则认为该矩形区域即为污点所在的区域,否则舍弃该矩形区域。这样通过上述四步,即可实现古籍文档二值图的污点检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京物资学院,未经北京物资学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310221753.0/1.html,转载请声明来源钻瓜专利网。