[发明专利]一种文本图像的长干扰线去除方法有效
申请号: | 201710302485.3 | 申请日: | 2017-04-28 |
公开(公告)号: | CN108805126B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 陈年 | 申请(专利权)人: | 上海斯睿德信息技术有限公司;上海风声企业信用征信有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 上海麦其知识产权代理事务所(普通合伙) 31257 | 代理人: | 董红曼;马旸 |
地址: | 200120 上海市浦东*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文本 图像 干扰 去除 方法 | ||
本发明公开了一种文本图像的长干扰线去除方法,包括:获取具有特征干扰线的彩色文本图像;将彩色文本图像转换到灰度空间并二值化得到二值化图像;以初始水平方向和初始垂直方向扫描二值图像,创建候选线段的起点和初始终点;更新候选线段的终点、斜率、长度;扫描完成,生成初始方向的候选线段集合;以相反方向与初始方向的组合获取候选线段并更新候选线段集合;根据干扰线的特性筛选得到干扰线;去除二值图像中的干扰线;填充二值图像中的文字笔画断笔;以二值图像为掩码图像提取前景像素值,背景像素赋值不同颜色。本发明能够自动去除文本图像中的任意数目、任意角度、任意颜色、任意位置的长干扰线。为后续的光学字符定位和识别奠定了基础。
技术领域
本发明涉及图像识别与信息处理领域,尤其涉及一种文本图像的长干扰线去除方法。
背景技术
随着计算机视觉和模式识别技术的快速发展,光学字符检测和识别技术的应用领域越来越广阔。因此,如何准确定位文本信息成为提高光学字符识别准确率的重要前提。但是,在去除文本图像噪音过程中,很多情况下导致文本笔画断裂和缺失,因此,如何在尽可能去除图像中的噪音以及文本无关的无用信息的情况下,保留文本信息成为光学字符识别的一项重要预处理工作。
在去除文本图像中的干扰线方面,许多研究文本分析学者给出了一些方法,这些方法大致可以归纳为二类。第一类,基于颜色特征的方法:根据干扰线与文本字符颜色差异性,将干扰线从文本图像中分割出来,从而达到去除干扰线的目的,这类方法可以很好地去除与文本颜色信息差异较大的干扰线;当干扰线与文本字符颜色相似甚至相同时,此类方法不能去除这类干扰线。第二类,基于宽度特征的方法:根据干扰线与文本字符笔画宽度差异性,当干扰线与字符笔画宽度不同时,可以通过适当的腐蚀膨胀操作去除干扰线且保留文本笔画;但当干扰线宽度与字符笔画宽度一致时,腐蚀膨胀操作去除干扰线的同时,也会丢失大量的字符笔画,故这类方法不适用于去除此类干扰线。针对此类文本图像中的干扰线,本发明提出了一种文本图像的长干扰线去除方法。
发明内容
本发明提出了一种文本图像的长干扰线去除方法,包括如下步骤:
步骤一:获取具有特征干扰线的彩色文本图像;
步骤二:将所述彩色文本图像转换到灰度空间,得到灰度图像;
步骤三:将所述灰度图像二值化处理,得到二值化图像;
步骤四:以初始水平方向和初始垂直方向扫描所述二值图像,创建候选线段的起点和初始终点;
步骤五:继续扫描所述二值图像,更新所述候选线段的终点、斜率、长度;
步骤六:扫描完成,生成初始方向的候选线段集合;
步骤七:以相反水平方向和初始垂直方向重复扫描所述二值图像,获取候选线段并更新所述候选线段集合;
步骤八:以初始水平方向和相反垂直方向重复扫描所述二值图像,获取候选线段并更新所述候选线段集合;
步骤九:以相反水平方向和相反垂直方向重复扫描所述二值图像,获取候选线段并更新所述候选线段集合;
步骤十:根据干扰线的特性,从所述候选线段集合中筛选得到干扰线;
步骤十一:去除所述二值图像中的干扰线;
步骤十二:填充所述二值图像中因干扰线去除后造成的文字笔画断笔;
步骤十三:以所述二值图像为掩码图像,从所述彩色文本图像中提取前景像素值,其余背景像素赋值为不同颜色。
本发明提出所述文本图像的长干扰线去除方法中,步骤三对所述灰度图像的二值化处理包括如下步骤:
3a.计算所述灰度图像中每一像素点局部领域块的灰度高斯加权和大小;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海斯睿德信息技术有限公司;上海风声企业信用征信有限公司,未经上海斯睿德信息技术有限公司;上海风声企业信用征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710302485.3/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序