[发明专利]一种基于空白背景以及连通域的版面分析方法在审
申请号: | 201810199200.2 | 申请日: | 2018-03-12 |
公开(公告)号: | CN108399623A | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 刘隆都;张廷银;孙中;宋凯华 | 申请(专利权)人: | 山东超越数控电子股份有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136;G06T7/187;G06T7/194 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250000 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空白背景 连通域 版面分析 图像 模块分割 前景区域 图像区块 普适性 拓展 图片 | ||
1.一种基于空白背景以及连通域的版面分析方法,其特征在于,包括:
(1)初步划分图像
先利用先验规律对图像进行划分,得到若干图块;
再采用霍夫变换方法检测出每个图块的空白直线,通过检测出的空白直线对每个图块进行划分,减少每个图块的空白区域;
(2)拓展图像字区域
判断通过步骤(1)获取的图像的每个像素点是否为外部点,如果判断该像素点I为外部点,不进行操作;如果判断为内部点,将其8-邻域全部填充为黑色,再次进行外部点检测,直到获取的图像中,所有的内部点其8邻域都已经被填充为黑色;
(3)拓展图像连通域
A、输入经过步骤(2)处理后的任一图像P,对图像P进行横向投影、纵向投影,分别得到px和py两幅投影图;
B、确定先验阈值a和b,对px中任一行i、py中任一列j,若满足:PixelX(i)<a×p.width||PixelY(j)<b×p.length,则认为i行或j列为空白行或空白列,并将空白行数或空白列数计入Sr或Sc,Sr为某一空白行所占像素行数,Sc为某一空白列所占像素列数;若是新出现的空白行或列,则同时计入Wr或Wc,Wr为图像中空白的行的数量,Wc为图像中空白的列的数量;新出现的行或列指与上一个空白像素行或列之间存在一非空白行或列;PixelX(i)为横向投影,PixelY(j)为纵向投影,p.width为图像的像素宽度,p.length为图像的像素长度;
C、求取Sr和Wr的比值,即平均连通阈值;
D、确认连通阈值之后,即通过高斯模糊拓展操作,对文本进行文本块连通操作;
(4)切分图像区块
E、将经过步骤(4)处理后的图片中所有像素值为黑色的点归为一个点集,从这个点集中选取任意一个点t,将点t加入一个新的子集s中,同时从原点集中删除点t;
F、搜索点t的8-邻域,从点t的8-邻域中的8个像素点中找到所有像素值为黑色的点加入到子集s中,并从子集s中删除点t,重复操作步骤F,直到子集s不再发生变化,此时子集s为某一区域的曲线边界的点集;
G、重复E操作,得到的每一个新子集都是一个区域的曲线边界的点集,直到某一次操作子集s中不存在任何的像素点,则切分图像区块结束,提取出来构成所有区块的曲线由子集的形式;
H、浏览所有曲线边界子集,找到子集中的点的左上角和右下角,根据这个值,进行区域的切割,左上角和右下角是界定将该区域完全包括的一个最小长方形区域,通过遍历子集中的点的横纵坐标进行比较获得所述区域。
2.根据权利要求1所述的一种基于空白背景以及连通域的版面分析方法,其特征在于,a=b=10%。
3.根据权利要求1或2所述的一种基于空白背景以及连通域的版面分析方法,其特征在于,判断通过步骤(1)获取的图像的每个像素点是否为外部点,包括:扫描整幅图像,对于任意一个像素点I,取其8-邻域像素区域,标号为I1、I2、I3、I4、I5、I6、I7、I8,判断该像素点I是否为外部点,即α=(I1&&I2&&I3)||(I3**I5&&I8)||(I6&&I7&&I8)是否为真,若为真,则判断该像素点I为外部点;若为假,则判断为内部点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东超越数控电子股份有限公司,未经山东超越数控电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810199200.2/1.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序