[发明专利]一种基于投影算子的古籍文档图像处理算法在审
申请号: | 201310221753.0 | 申请日: | 2013-06-06 |
公开(公告)号: | CN104239880A | 公开(公告)日: | 2014-12-24 |
发明(设计)人: | 姚志英;曹海青 | 申请(专利权)人: | 北京物资学院 |
主分类号: | G06K9/46 | 分类号: | G06K9/46;G06T7/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 101149 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 投影 算子 古籍 文档 图像 处理 算法 | ||
技术领域
本发明属于图像处理技术领域,涉及古籍文档灰度图像二值化方法、古籍文档图像的边框检测方法和污点检测方法,具体而言是通过定义水平投影算子和垂直投影算子,并应用于古籍文档灰度图像二值化的阈值选取,将投影算子应用于古籍文档中边框检测和污点检测。
背景技术
古籍是中华人民共和国的宝贵财富和民族文化发展的缩影,古籍文化是中华民族思想传承的载体,在信息数字化的时代,将古籍内容进行数字化的加工是古籍长期保存的发展趋势;目前的古籍有手写本、印刷本、骨刻本等多重形式,其内容行文格式更是千姿百态,形式各异,加大了古籍文档数字化加工的技术难度,其中古籍图像的处理是核心难点。研究发现在古籍文档的加工中,手写本和印刷本的古籍文档每本古籍文稿的版式和样式基本相同,有一定的规律性。因此为提高古籍文档数字加工的效率,古籍文档图像的处理技术成为人们研究的热门课题,尤其是古籍文档图像的二值化、古籍文档的边框检测和污点检测。
图像二值化的关键是二值化阈值的选取,不同的阈值选取法对二值化的效率和二值化图像的质量有较大的影响;当前阈值选取的方法主要有直方图与直方图变换法、最大类间方差(otsu)法、最小误差法与均匀化误差法、共生矩阵法、最大熵方法、简单统计、概率松弛法和模糊集法等。传统的图像污点检测方法的核心都是通过遍历二值化图像的内容矩阵寻找图像连通域,这种方法对于内容简单、尺寸较小的图像,检测效果还可以,然而一旦图像内容复杂、尺寸较大时,这些污点检测算法的时间和空间复杂度将成级数般地递增,其污点检测效率极低。传统的文档边框的检测主要是通过图像边缘检测技术来实现的,传统的边缘检测算子主要有Sobe1算子、Canny算 子和Prewitt算子,这些算子是一阶或二阶微分算子,对于清晰图像检测效果较好,但对于历史悠久、保存质量不理想的古籍文档而言,存在着去除噪声和边缘准确定位之间的矛盾,经常出现误检和漏检,当然也有一些基于滤波技术和小波变换技术的改进边缘检测算法,但这些算法在滤波过程中有时会使得古籍文档边缘弱化和模糊化,造成边框检测的不准确。
本发明将设计一种投影算子应用于古籍文档图像的处理中,主要是实现古籍文档灰度图像二值化阈值的合理选取、古籍文档二值化图中边缘的准确检测和文档中符合设定条件的污点检测。
发明内容
本发明旨在提供一种基于投影算子的古籍文档图像处理算法,该算法能高效快捷地实现古籍文档灰度图像二值化阈值的选取、古籍文档图像中边框检测和污点检测。
本发明实现上述目的的技术方案是,一种基于投影算子的古籍文档图像处理算法,其创新点在于:对古籍文档灰度图像进行二值化时,根据古籍文档的内容和结构进行文档灰度图像的区域划分,对不同的子区域利用投影算子求出其灰度均值作为该区域图像内容二值化的阈值,这样通过对不同区域二值化来实现对整个图像的二值化;
本发明实现上述目的的技术方案是,一种基于投影算子的古籍文档图像处理算法,其创新点在于:对于古籍文档边框检测的步骤依次为:
(1)对通过图像采集设备所采集到的大小尺寸为W×L的古籍文档彩色图像进行二值化处理,得到古籍文档的二值化图;
(2)根据二值化图的内容,生成图像内容矩阵CW×L,其中C[i][j]=0或C[i][j]=1;
(3)对二值化图进行水平投影,即求矩阵CW×L每一列元素的和构成数组 对二值化图进行垂直投影,即求矩阵CW×L每一行元 素的和构成数组
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京物资学院,未经北京物资学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310221753.0/2.html,转载请声明来源钻瓜专利网。