[发明专利]一种文本行图像单字切分方法和装置在审
申请号: | 201711294411.6 | 申请日: | 2017-12-08 |
公开(公告)号: | CN108171237A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 邱君华;李宏宇 | 申请(专利权)人: | 众安信息技术服务有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 张慧娟 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 粘连字符 文本行图像 单字 连通域 预设 方法和装置 文本行 图像处理技术 预处理 提取预处理 形态学处理 断开 场景 | ||
本发明公开了一种文本行图像单字切分方法和装置,属于图像处理技术领域。包括对文本行图像进行预处理,并提取预处理后的文本行图像中的文本行;判断文本行中是否存在包含有粘连字符的连通域,若存在,则确认预设的执行模式,否则执行非粘连字符切分策略;在存在包含有粘连字符的连通域时,若预设的执行模式为第一执行模式,则利用形态学处理断开包含有粘连字符的连通域,并执行非粘连字符切分策略;若确认预设的执行模式为第二执行模式,则执行非粘连字符切分策略。本发明实施例能够针对文本行图像的粘连字符以及非粘连字符的不同场景,对单字切分方式加以区分,提高对文本行图像单字切分的准确性。
技术领域
本发明涉及图像处理技术领域,特别涉及一种文本行图像单字切分方法和装置。
背景技术
OCR(Optical Character Recognition,字符识别)的流程一般是先做文本行图像检测,然后再对文本行图像进行单字切分,最后对每个切分出的单字进行识别。显然,文本行图像中的单字切分是字符识别中相当重要的环节,直接影响到最后的识别准确率。
目前,对文本行图像进行单字切分,通常采用的单字切分方式是基于投影分割法,该方法利用字与字之间的空白间隙在图像行垂直投影上形成的空白间隔将单个的字符图像切分出来。
但是,发明人在本申请的研究过程中发现,在实际应用中,文本行图像的相邻字符间可能发生粘连,也可能不粘连,此时采用基于投影分割法对文本行图像进行单字切分,就会将发生粘连的字符误切分为一个字符,出现分割错误,同时,也会将某个字符的中文部首误切分为一个独立字符,进而导致字符切分的准确性较低,因此针对文本行图像的粘连字符以及非粘连字符的不同场景,需要对单字切分方式加以区分,以提高对文本行图像单字切分的准确性。
发明内容
为了解决现有技术的问题,本发明实施例提供了一种文本行图像单字切分方法和装置,以针对文本行图像的粘连字符以及非粘连字符的不同场景,对单字切分方式加以区分,实现提高对文本行图像单字切分的准确性的目的。所述技术方案如下:
第一方面,提供了一种文本行图像单字切分方法,所述方法包括:
步骤S1:对文本行图像进行预处理,并提取预处理后的所述文本行图像中的文本行;
步骤S2:判断所述文本行中是否存在包含有粘连字符的连通域,若存在,则执行步骤S3,否则执行步骤S5;
步骤S3:确认预设的执行模式是为第一执行模式还是为第二执行模式,若为所述第一执行模式,则执行步骤S4,若为所述第二执行模式,则执行步骤S6;
步骤S4:利用形态学处理断开所述包含有粘连字符的连通域,执行步骤S5;
步骤S5:执行非粘连字符切分策略,对所述文本行进行单字切分;
步骤S6:执行粘连字符切分策略,对所述文本行进行单字切分。
结合第一方面,在第一种可能的实现方式中,所述步骤S1中对文本行图像进行预处理包括:
步骤S11:获取所述文本行图像的灰度图;
步骤S12:采用预设聚类算法对所述文本行图像的灰度图进行聚类分割;
步骤S13:根据聚类分割结果,确定所述文本行图像的背景和作为前景的所述文本行;
步骤S14:调整作为前景的所述文本行的像素亮度值高于背景的像素亮度值。
结合第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述步骤S1中对文本行图像进行预处理进一步还包括:
步骤S15:若所述文本行与所述背景的像素平均值差值小于预设差值阈值,则对所述文本行图像的灰度图进行灰度拉伸处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711294411.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种LED字符自动定位方法
- 下一篇:一种车牌的倾斜角度检测方法及装置