[发明专利]一种基于空白背景以及连通域的版面分析方法在审
申请号: | 201810199200.2 | 申请日: | 2018-03-12 |
公开(公告)号: | CN108399623A | 公开(公告)日: | 2018-08-14 |
发明(设计)人: | 刘隆都;张廷银;孙中;宋凯华 | 申请(专利权)人: | 山东超越数控电子股份有限公司 |
主分类号: | G06T7/11 | 分类号: | G06T7/11;G06T7/136;G06T7/187;G06T7/194 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250000 山东省*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 空白背景 连通域 版面分析 图像 模块分割 前景区域 图像区块 普适性 拓展 图片 | ||
本发明涉及一种基于空白背景以及连通域的版面分析方法,包括:(1)初步划分图像;(2)拓展图像字区域;(3)拓展图像连通域;(4)切分图像区块。本发明基于空白背景以及连通域,本发明版面分析方法综合了空白背景方法以及连通域方法,在基于空白背景的方法中,将图片中前景区域的各个模块分割出来,该方法过程简单,具有较高精度以及普适性。
技术领域
本发明涉及一种基于空白背景以及连通域的版面分析方法,属于计算机技术领域。
背景技术
随着计算机以及计算机网络的飞速发展,信息的传播途径从实体转为电子,将实体书籍报刊、研究文稿转换成电子格式的需求日渐增加,同时对于识别精度的要求也日渐增加。
基于以上需求,ocr技术应运而生。OCR即Optical Character Recognition,光学字符识别,是指用计算机将书写体或印刷体的汉字,通过光学扫描设备,扫描进电脑;再通过一系列图像处理技术,去除彩色分量,纠正图像倾斜,图像分割等动作,识别成能储存在电脑中的计算机文字。
传统ocr系统一般由输入、处理、输出三个部分组成。如图1所示,得益于便携式输入输出设别(诸如手机)的发展,目前局限ocr系统的部分主要是处理这一环节。而在处理这一环节中,版面分析与版面理解两个部分在系统中的作用是极其核心的,在整个系统中,版面分析与版面理解所进行的工作主要就是利用计算机自动的对图像进行区域的划分,识别出区域的属性,以及区域之间的关系。版面分析的主要工作,是对图像空间上进行区域的划分。版面理解的功能主要是对区域之间逻辑上的先后顺序,进行判断。
传统的基于连通域的版面分割方法有以下两种,第一,基于组成元素的版面分割算法,该算法本质上是一种自底向上的版面分割算法。该分割算法从底层出发,将整个图片划分成一个个的字,从图像底层进行分割,然后合并成行、段、列、图片等。最终得到完整的文本块,并且在合并的过程中,可以得到一些属性。该算法的优点是对各种不同的版面都有很强的适应性,缺点是运算量大,并且消耗的时间比较长。第二,基于连通域的版面分割算法,该算法从图像的整体出发,通过对图像像素进行的投影操作,获得一些基本的参数,比如说字间距,连通阈值等,通过连通阈值将图像进行联通操作得到整个文本块,进行分割。该算法优点是对各种不同的版面都有很强的适应性,同时算法的时间复杂度也比较好。缺点是对于一些连通阈值特征不明显的版面,分割的效果较差。
传统的基于连通域的版面分割方法,由于直接对图像进行投影操作,由于字体内部的空白像素对整体的影响,造成误差较大。因此,传统版面分析方法中版面识别不具有普适性,并且精度较低。
发明内容
针对现有技术的不足,本发明提供了一种基于空白背景以及连通域的版面分析方法;
基于空白背景以及连通域,本发明版面分析方法综合了空白背景方法以及连通域方法,在基于空白背景的方法中,将图片中前景区域的各个模块分割出来,该方法过程简单,适用于空白区域较大的版面类型。
术语解释:
1、霍夫变换,Hough Transform,是图像处理中从图像中识别几何形状的基本方法之一,应用很广泛,也有很多改进算法。主要用来从图像中分离出具有某种相同特征的几何形状(如,直线,圆等)。
2、横向、纵向投影,是指将图像的以横轴、纵轴为坐标,统计某个坐标上黑色像素点的数量。
本发明的技术方案为:
一种基于空白背景以及连通域的版面分析方法,包括:
(1)初步划分图像
先利用先验规律对图像进行划分,得到若干图块;
再采用霍夫变换方法检测出每个图块的空白直线,通过检测出的空白直线对每个图块进行划分,减少每个图块的空白区域;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东超越数控电子股份有限公司,未经山东超越数控电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810199200.2/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序