[发明专利]一种扫描文档图像纠偏方法有效
申请号: | 201610404924.7 | 申请日: | 2016-06-07 |
公开(公告)号: | CN106097254B | 公开(公告)日: | 2019-04-16 |
发明(设计)人: | 王建 | 申请(专利权)人: | 天津大学 |
主分类号: | G06T3/60 | 分类号: | G06T3/60;G06T5/00 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程毓英 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种扫描文档图像纠偏方法,包括:转换成灰度图像;进行滤波;提取边缘点二值图;借助投影分析计算扫描文档图像的倾斜角;根据Q计算文本区域的边界,进而计算出偏移量,并借助平移操作使文本区域居中。本发明通过检测输入扫描文档图像的倾斜度,对原始文档图像进行倾斜度矫正,可得到视觉质量更佳的文档图像。 | ||
搜索关键词: | 一种 扫描 文档 图像 纠偏 方法 | ||
【主权项】:
1.一种扫描文档图像纠偏方法,包括下列步骤:1)对于输入的扫描文档,先转换成灰度图像为I;2)进行平滑滤波处理,处理结果用F表示;3)提取边缘点二值图E,方法如下:利用水平和垂直模板对F进行滤波处理,得到水平和垂直梯度强度图,分别用GH和GV,总的梯度强度图为G=|GH|+|GV|;计算G的最大值,用Gmax表示,使用下式得到边缘点二值图E:
4)借助投影分析计算扫描文档图像的倾斜角,定义扫描文档的倾斜角为文本行与水平线按顺时针方向的夹角,用
表示,使用以下算法检测倾斜角:第1步:初始化倾斜角度值θ和扫描图像总行数R,θ的初始值设为45°,在[‑45°,45°]之间逐渐调整θ;第2步:根据θ的取值,如果θ是正值,则将E图逆时针旋转θ;如果θ为负值,则将E图顺时针旋转‑θ,旋转结果用Eθ表示;第3步:计算Eθ各行在水平方向的投影值,用Eθ(r)表示,其中r=1,2,...,R,r表示扫描文档图像的行号;第4步:计算Eθ(r)的最大值,用Eθ(max)表示,对于第r扫描行,如果满足Eθ(r)>0.6×Eθ(max),则将该行判为旋转角为θ的一个有效扫描行;第5步:计算旋转角θ对应的有效投影行总数,用N(θ)表示,使用N(θ)计算旋转角θ对应的能量函数P(θ),它定义为:
第6步:判断是否满足θ=‑45°,如果满足,跳至第7步;否则,改变θ=θ‑1°,跳至第2步;第7步:计算P(θ)中的最大值,并确定该最大值所对应的角度,用θmax表示;将θmax判为文档图像的倾斜角
根据倾斜角
的大小,如果
则将F顺时针旋转
度;否则,将F逆时针旋转
度,旋转过程中使用的插值方法为双线性插值,将经过倾斜角矫正处理后的图像用Q表示;5)根据Q计算文本区域的边界,进而计算出偏移量,并借助平移操作使文本区域居中,方法如下:第1步:计算Q的尺寸,用HET和WID分别表示Q的高度和宽度,其中心点用HET/2和WID/2表示;第2步:计算Q的直方图,使用最大类间方差法计算阈值TH;使用TH,将Q转化为二值图B;第3步:计算B各行在水平方向的投影值,用H(r)表示,其中r表示扫描文档图像的行号;第4步:计算H(r)的最大值,用Hmax表示,对于第r扫描行,如果满足H(r)<0.5×Hmax,则将该行判为有效文本行,记为H(r′);第5步:计算B各行在垂直方向的投影值,用V(c)表示,其中c表示扫描文档图像的列号;第6步:计算V(c)的最大值,用Vmax表示,对于第c扫描行,如果满足V(c)<0.5×Vmax,则将该行判为有效文本列,记为V(c′);第7步:计算H(r′)中最上方文本行和最下方文本行的位置,分别用TOP和BOT表示;计算V(c′)中最左侧文本列与最右侧文本列的位置,用RHT和LEFT表示;计算文本区域的中心点坐标,用CENTx和CENTy表示;第8步:对于Q进行文本居中处理。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201610404924.7/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据变换方法和装置
- 下一篇:一种自动气象站质量控制方法
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序