[发明专利]扭曲文档图像的校正方法在审

专利信息
申请号: 201810723247.4 申请日: 2018-07-04
公开(公告)号: CN108921804A 公开(公告)日: 2018-11-30
发明(设计)人: 潘明强;久磊;刘吉柱;王阳俊 申请(专利权)人: 苏州大学
主分类号: G06T5/00 分类号: G06T5/00;G06T7/13
代理公司: 苏州谨和知识产权代理事务所(特殊普通合伙) 32295 代理人: 叶栋
地址: 215104 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 校正 文档图像 扭曲 角点 二值图像 目标图像 位置映射 预处理 自动化性能 畸变函数 畸变校正 角点检测 目标提取 像素空间 小孔成像 校正图像 连通域 文本框 灰度 拟合 检测
【说明书】:

发明涉及一种扭曲文档图像的校正方法,其特征在于,包括以下步骤:S1、获取扭曲文档图像,对扭曲文档图像进行预处理,得到二值图像;S2、对二值图像进行目标提取,获得目标图像,对目标图像进行角点检测,得到所述角点的位置信息;S3、根据角点和位置信息进行连通域检测,以生成文本框并拟合曲面畸变函数,再根据小孔成像原理和畸变校正原理确定校正前后角点的位置映射关系;S4、根据位置映射关系完成像素空间变换,最后进行灰度插值得到校正图像。该校正方法具有自动化性能高、校正效果好、简单实用的特点。

技术领域

本发明涉及一种扭曲文档图像的校正方法。

背景技术

手持数字成像设备具有成像简单、快速以及非接触的特点,其极大地丰富了扭曲文档图像的获取方式,但是在成像过程中会不可避免地产生扭曲形变和透视失真,导致光学字符识别(OCR)软件中的版面分析和切分算法失效,从而使扭曲文档图像无法被识别。因此必须首先通过图像校正的方法对这种变形文档进行图像恢复。

发明内容

本发明的目的在于提供一种扭曲文档图像的校正方法,通过简单实用的校正算法将扭曲文档图像恢复为校正图像,具有自动化性能高、校正效果好的特点。

为达到上述目的,本发明提供如下技术方案:一种扭曲文档图像的校正方法,包括以下步骤:

S1、获取扭曲文档图像,对所述扭曲文档图像进行预处理,得到二值图像;

S2、对所述二值图像进行目标提取,获得目标图像,对所述目标图像进行角点检测,得到所述角点的位置信息;

S3、根据所述角点和位置信息进行连通域检测,以生成文本框并拟合曲面畸变函数,再根据小孔成像原理和畸变校正原理确定校正前后所述角点的位置映射关系;

S4、根据所述位置映射关系完成像素空间变换,最后进行灰度插值得到校正图像。

进一步地,所述扭曲文档图像通过图像采集设备获取,所述图像采集设备包括扫描仪、手机、数码相机等能将纸质文档转变为扭曲文档图像的方便携带的设备,所述扭曲文档图像为拍摄设备正视拍摄原始扭曲文档下的扭曲图像。

进一步地,步骤S1中,所述预处理包括以下步骤:

a1、灰度处理,将所述扭曲文档图像中的每个像素信息由一个量化后的灰度级来描述,所述的像素选自0-225中的任一值;

a2、二值化,将灰度处理后的扭曲文档图像中背景的像素值设置为0,文档区域像素值设置为1,从而将所述扭曲文档图像变为黑白状态,得到二值图像。

进一步的,所述扭曲文档图像包括目标图像和背景信息,所述目标图像是单纯的扭曲文本页面图像,所述背景信息则是其余的图像信息,所述目标图像的提取只需获取目标边界清晰轮廓即可,但要保证文本的扭曲信息不能被破坏。

进一步地,步骤S2中,所述目标提取包括边缘检测,所述边缘检测为canny边缘检测法,通过所述边缘检测得到所述二值图像的重要线条和轮廓。

进一步地,所述目标提取还包括轮廓提取,对边缘检测后的二值图像进行轮廓提取得到所述目标图像。

进一步地,所述canny边缘检测采用双阈值值法,高阈值用来检测图像中重要的、显著的线条、轮廓等,而低阈值用来保证不丢失细节部分,低阈值检测出来的边缘更丰富。然后采用查找算法,将低阈值中与高阈值的边缘有重叠的线条保留,其他的线条都删除。所述轮廓提取选取图像中包围的面积最大的轮廓作为目标轮廓,并将其从背景信息中提取出来。

进一步地,所述角点检测是根据轮廓图像的黑白比例急剧变化的点或者是图像边缘曲率极大值点,所述角点在图像中梯度值和梯度方向的变化速率都很高。

进一步地,步骤S2中,所述角点检测包括以下步骤:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810723247.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top