[发明专利]基于Harr-like特征的文档倾斜校正方法有效
申请号: | 201210170270.8 | 申请日: | 2012-05-28 |
公开(公告)号: | CN102693424A | 公开(公告)日: | 2012-09-26 |
发明(设计)人: | 宋利;刘兵;董莉莉 | 申请(专利权)人: | 上海交通大学 |
主分类号: | G06K9/32 | 分类号: | G06K9/32 |
代理公司: | 上海汉声知识产权代理有限公司 31236 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 harr like 特征 文档 倾斜 校正 方法 | ||
技术领域
本发明涉及的是一种文档图像处理技术领域的方法,具体是一种基于Harr-like特征的文档倾斜校正方法。
背景技术
文档图像倾斜校正是一种重要的文档图像预处理技术。一般的文档分析系统(DAS)像文档版面分析,光符识别,文档检索等往往要求输入的图像是没有倾斜的。然而,实际过程中,文档通过图像获取设备(如数码相机,扫描仪等)转化成图像的过程中由于人为因素或是扫描仪本身存在机械误差,最终得到的文档图像难免会有一定的倾斜。倾斜的图像如果得不到精确的校正可能会严重影响文档分析系统的性能,例如对于文档版面分析,如果输入的文档图像具有一定的倾斜角度,字符会发生变形,字符间的分隔及OCR识别精度会受到较大的影响,这就要求文档图像预处理过程中引入图像校正这一关键技术。
文档倾斜校正一般分为手动校正和自动校正。手动校正是指依靠人为干预对输入图像进行倾斜估计并借助软件工具对图像进行倾斜校正。由于现实中要处理的文档是海量的,仅仅依靠人工进行倾斜校正,不仅浪费人力,而且效率低。因此,由计算机对输入图像进行必要的倾斜角度估计,实现文档图像倾斜自动校正得到了广泛的研究和关注。目前,有很多的关于文档倾斜校正技术在实际的文档分析系统中得到了应用。但这些方法往往针对的是特定类型的文档,对于文档的内容,语言以及版面结构有一定的要求。对于一般的文档,一方面,文档种类繁多,版面结构复杂,文档中包含不同的语言,有的还含有大尺度的图,表,公式以及不规范的手写体;另一方面,扫描后的文档图像可能会含有不同程度的噪声。这些因素使得文档图像倾斜校正成为了文档图像预处理技术中的难点。发明一种适用于一般文档图像倾斜校正方法具有重要的意义。
传统的文档图像倾斜校正方法主要有:投影轮廓分析法,Hough变换法,连通体分析法。
投影轮廓分析法首先对文档图像在水平方向或者垂直方向进行投影,然后利用投影直方图的代价函数计算倾斜角度。这种方法虽然简单,但由于采用的是穷举搜索,速度慢,倾斜角度的检测范围往往限制在[-15°,15°]内。另外,该方法的检测精度也不是很高。J.Sadri和M.Cheriet,在2009年10th International Conference on Document Analysis and Recognition(第10届文档分析识别国际会议)发表的“A New Approach for Skew Correction of Documents Based on Particle Swarm Optimization”(一种基于粒子群优化的文档倾斜校正的新方法)一文中通过粒子群优化策略寻找目标函数极值,大大减少了倾斜角搜索次数,提高了倾角检测速度.A.Papandreou和B.Gatos在2011年11th International Conference on Document Analysis and Recognition(第11届文档分析识别国际会议)发表的“ANovel Skew Detection Technique Based on Vertical Projections”(一种基于垂直投影的倾斜检测技术)一文中结合垂直投影和边界框(bounding box)提高了倾角检测精度。Hough变换法是借助Hough变换,在文档图像的Hough空间中寻找极值对倾斜角进行估计。Hough变换法精度高,没有倾斜角度检测范围的限制,不过算法计算复杂度高。连通体分析法首先将文档图像分成不同的连通部件,通过分析这些区域的特征估计倾斜角。
发明内容
本发明为了解决现有技术中的杉树问题,提供一种新的图像倾斜校正方法,即基于Harr-like特征的文档倾斜校正方法,该方法对于一般的文档图像倾斜估计结果准确而可靠。
本发明是通过以下技术方案实现的,本发明借助Harr-like特征,先对输入图像划分子区域,然后在这些子区域内计算目标函数,根据目标函数极值进行文档倾角估计,对输入文档图像实施倾斜校正。
所述的Harr-like特征最初由Papageorgiou等提出用于人脸特征表示。后来研究人员又对其进行了许多扩展,得到了多种类型的Harr-like特征。本发明使用简单Harr-like 2-矩形特征用于文档图像倾斜校正。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210170270.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:布点固定式森林火情监测系统
- 下一篇:液晶显示面板的制作方法
- 苏云金芽胞杆菌vip1like1、vip2like1基因组合及其应用
- 大豆开花基因FL1(PRR-like)及其编码蛋白
- 一种利用RNA干扰防治红火蚁的方法及降低红火蚁抗药性的应用
- 一种利用RNA干扰防治红火蚁的方法及降低红火蚁抗药性的应用
- 基于Haar-like特征的水稻病害白穂识别方法及系统
- 用于鉴别猪蓝耳病毒经典株与NADC30-Like株的冻干微芯片、试剂盒及方法
- 一种GST-like标签蛋白在大肠杆菌表达体系中的应用
- 猪笼草wcor413-like蛋白及其应用
- 一个调控油菜素内酯信号转导的基因BnC04BIN2-like1及其应用
- 小麦TaC3HC4-like基因在调控小麦粒厚发育中的应用