[发明专利]一种版面分析方法及装置有效
申请号: | 201710293776.0 | 申请日: | 2017-04-28 |
公开(公告)号: | CN108804978B | 公开(公告)日: | 2022-04-12 |
发明(设计)人: | 唐文 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G06K9/00 | 分类号: | G06K9/00 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 版面 分析 方法 装置 | ||
1.一种版面分析方法,其特征在于,所述方法包括;
对待分析版面的原图像进行二值化处理后,得到二值化图像,所述二值化图像具有水平阈值和垂直阈值;
逐行扫描所述二值化图像,将每行中连续存在个数小于所述水平阈值且灰度值为255的像素点的灰度值置0,得到第一图像;
以及,逐列扫描所述二值化图像,将每列中连续存在个数小于所述垂直阈值且灰度值为255的像素点的灰度值置0,得到第二图像;
将所述第一图像和所述第二图像上灰度值为0的像素点标记为1,灰度值为255的像素点标记为0;
对所述第一图像与所述第二图像上相同位置的像素点执行或操作,得到第三图像,以使所述第三图像上黑色像素点更加连续;
获取所述第三图像上的黑色连通区域,并计算出每个黑色连通区域的位置信息;
利用所述位置信息,对所述待分析版面的原图像进行标注,得到所述原图像上的标注区域;
所述方法还包括:
获取所述二值化图像上的黑色连通区域;
获取各个黑色连通区域的宽值和高值后,计算所述宽值和所述高值的乘积的平方根,作为该黑色连通区域的宽高值;
将各个黑色连通区域的宽高值中不属于预设门限范围的宽高值进行剔除;
计算所述二值化图像上的黑色连通区域的平均宽高值;
将所述平均宽高值乘以第三预设倍数得到的值,作为所述二值化图像的垂直阈值和水平阈值。
2.根据权利要求1所述的版面分析方法,其特征在于,所述黑色连通区域的位置信息包括所述黑色连通区域所在的面积最小的矩形的至少三个顶点坐标。
3.一种版面分析装置,其特征在于,所述装置包括;
二值化处理模块,用于对待分析版面的原图像进行二值化处理后,得到二值化图像,所述二值化图像具有水平阈值和垂直阈值;
第一置零模块,用于逐行扫描所述二值化图像,将每行中连续存在个数小于所述水平阈值且灰度值为255的像素点的灰度值置0,得到第一图像;
第二置零模块,用于逐列扫描所述二值化图像,将每列中连续存在个数小于所述垂直阈值且灰度值为255的像素点的灰度值置0,得到第二图像;
标记模块,用于将所述第一图像和所述第二图像上灰度值为0的像素点标记为1,灰度值为255的像素点标记为0;
或操作模块,用于对所述第一图像与所述第二图像上相同位置的像素点执行或操作,得到第三图像,以使所述第三图像上黑色像素点更加连续;
第一获取模块,用于获取所述第三图像上的黑色连通区域,并计算出每个黑色连通区域的位置信息;
标注模块,用于利用所述位置信息,对所述待分析版面的原图像进行标注,得到所述原图像上的标注区域;
所述装置还包括:
第四获取模块,用于获取所述二值化图像上的黑色连通区域;
第五计算模块,用于获取各个黑色连通区域的宽值和高值后,计算所述宽值和所述高值的乘积的平方根,作为该黑色连通区域的宽高值;
第六计算模块,用于计算所述二值化图像上的黑色连通区域的平均宽高值;
第七计算模块,用于将所述平均宽高值乘以第三预设倍数得到的值,作为所述二值化图像的垂直阈值和水平阈值。
4.根据权利要求3所述的版面分析装置,其特征在于,所述第一获取模块,具体用于获取所述第三图像上的黑色连通区域,并获取每个黑色连通区域所在的面积最小的矩形的至少三个顶点坐标。
5.一种计算机设备,其特征在于,包括处理器和存储器;
所述存储器用于存储软件程序;
所述处理器用于运行所述软件程序,以实现如权利要求1至2任一项所述的版面分析方法。
6.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有软件程序,所述软件程序用于在被处理器运行时,实现如权利要求1至2任一项所述的版面分析方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710293776.0/1.html,转载请声明来源钻瓜专利网。