[发明专利]一种文本行图像单字切分方法和装置在审
申请号: | 201711294411.6 | 申请日: | 2017-12-08 |
公开(公告)号: | CN108171237A | 公开(公告)日: | 2018-06-15 |
发明(设计)人: | 邱君华;李宏宇 | 申请(专利权)人: | 众安信息技术服务有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06K9/46;G06K9/62 |
代理公司: | 北京市万慧达律师事务所 11111 | 代理人: | 张慧娟 |
地址: | 518000 广东省深圳市前海深港合作区前*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种文本行图像单字切分方法和装置,属于图像处理技术领域。包括对文本行图像进行预处理,并提取预处理后的文本行图像中的文本行;判断文本行中是否存在包含有粘连字符的连通域,若存在,则确认预设的执行模式,否则执行非粘连字符切分策略;在存在包含有粘连字符的连通域时,若预设的执行模式为第一执行模式,则利用形态学处理断开包含有粘连字符的连通域,并执行非粘连字符切分策略;若确认预设的执行模式为第二执行模式,则执行非粘连字符切分策略。本发明实施例能够针对文本行图像的粘连字符以及非粘连字符的不同场景,对单字切分方式加以区分,提高对文本行图像单字切分的准确性。 1 | ||
搜索关键词: | 粘连字符 文本行图像 单字 连通域 预设 方法和装置 文本行 图像处理技术 预处理 提取预处理 形态学处理 断开 场景 | ||
步骤S1:对文本行图像进行预处理,并提取预处理后的所述文本行图像中的文本行;
步骤S2:判断所述文本行中是否存在包含有粘连字符的连通域,若存在,则执行步骤S3,否则执行步骤S5;
步骤S3:确认预设的执行模式是为第一执行模式还是为第二执行模式,若为所述第一执行模式,则执行步骤S4,若为所述第二执行模式,则执行步骤S6;
步骤S4:利用形态学处理断开所述包含有粘连字符的连通域,执行步骤S5;
步骤S5:执行非粘连字符切分策略,对所述文本行进行单字切分;
步骤S6:执行粘连字符切分策略,对所述文本行进行单字切分。
2.根据权利要求1所述的方法,其特征在于,所述步骤S1中对文本行图像进行预处理包括:步骤S11:获取所述文本行图像的灰度图;
步骤S12:采用预设聚类算法对所述文本行图像的灰度图进行聚类分割;
步骤S13:根据聚类分割结果,确定所述文本行图像的背景和作为前景的所述文本行;
步骤S14:调整作为前景的所述文本行的像素亮度值高于背景的像素亮度值。
3.根据权利要求2所述的方法,其特征在于,所述步骤S1中对文本行图像进行预处理进一步还包括:步骤S15:若所述文本行与所述背景的像素平均值差值小于预设差值阈值,则对所述文本行图像的灰度图进行灰度拉伸处理。
4.根据权利要求1所述的方法,其特征在于,所述步骤S2中判断所述文本行中是否存在包含有粘连字符的连通域包括:步骤S21:确定所述文本行的各个连通域的宽度值;
步骤S22:检测是否存在宽度突变的连通域,若存在,则判定存在宽度突变的连通域为所述包含有粘连字符的连通域。
5.根据权利要求1所述的方法,其特征在于,所述步骤S5包括:步骤S51:在所述文本行的所有连通域中,将满足连通域合并规则的连通域合并成合并区域;以及
步骤S52:基于合并后得到的各个合并区域及未合并的各个连通域,对所述文本行进行单字切分。
6.根据权利要求5所述的方法,其特征在于,所述步骤S51包括:步骤S511:在垂直方向上合并具有上下位置关系的至少两个连通域;
步骤S512:在水平方向上合并具有重叠关系的至少两个连通域;
步骤S513:合并间距小于所述所有连通域中两两相邻连通域的平均间距的两个相邻连通域;
其中,所述合并区域的宽度不超过由所述所有连通域的平均宽度确定的宽度阈值。
7.根据权利要求1所述的方法,其特征在于,所述步骤S6包括:步骤S61:确定所述文本行的平均字符宽度;
步骤S62:根据所述平均字符宽度和所述文本行的垂直投影直方图,获取所述垂直投影直方图上的多个目标切分点;
其中,所述多个目标切分点中的两两相邻切分点的间距不超过由所述平均字符宽度确定的宽度阈值;
步骤S63:根据所述多个目标切分点,对所述文本行进行单字切分。
8.根据权利要求7所述的方法,其特征在于,所述步骤S62包括:步骤S621:根据所述平均字符宽度和所述文本行的垂直投影直方图,确定所述文本行的当前切分位置,所述当前切分位置与上一个字符左边界之间的距离设定为所述平均字符宽度;
步骤S622:在所述当前切分位置所在区域内,获取三个候选切分点;
步骤S623:在所述三个候选切分点中,将像素值最小且像素值低于所述垂直投影直方图上像素平均值的切分点确定为当前目标切分点;
步骤S624:确定所述当前目标切分点的下一个像素点为下一个字符左边界;
重复步骤S622至步骤S624,直至获取到所有的目标切分点。
9.一种文本行图像单字切分装置,其特征在于,所述装置包括:预处理模块,用于对文本行图像进行预处理;
提取模块,与所述预处理模块连接,用于提取预处理后的所述文本行图像中的文本行;
判断模块,与所述提取模块连接,用于判断所述文本行中是否存在包含有粘连字符的连通域;
确认模块,与所述判断模块连接,用于若存在包含有粘连字符的连通域时,确认预设的执行模式是为第一执行模式还是为第二执行模式;
断开模块,与所述确认模块连接,用于若为所述第一执行模式时,利用形态学处理断开所述包含有粘连字符的连通域;
非粘连字符切分模块,与所述判断模块及所述断开模块连接,用于执行非粘连字符切分策略,对所述文本行进行单字切分;
粘连字符切分模块,与所述确认模块连接,用于若为所述第二执行模式时,执行粘连字符切分策略,对所述文本行进行单字切分。
10.根据权利要求9所述的装置,其特征在于,所述预处理模块具体包括:第一获取子模块,用于获取所述文本行图像的灰度图;
聚类分割子模块,用于采用预设聚类算法对所述文本行图像的灰度图进行聚类分割;
第一确定子模块,用于根据聚类分割结果,确定所述文本行图像的背景和作为前景的所述文本行;
调整子模块,用于调整作为前景的所述文本行的像素亮度值高于背景的像素亮度值。
11.根据权利要求10所述的装置,其特征在于,所述预处理模块进一步还包括:灰度拉伸处理子模块,用于若所述文本行与所述背景的像素平均值差值小于预设差值阈值,则对所述文本行图像的灰度图进行灰度拉伸处理。
12.根据权利要求9所述的装置,其特征在于,所述判断模块包括:第二确定子模块,用于确定所述文本行的各个连通域的宽度值;
检测子模块,用于检测是否存在宽度突变的连通域,若存在,则判定存在宽度突变的连通域为所述包含有粘连字符的连通域。
13.根据权利要求9所述的装置,其特征在于,所述非粘连字符切分模块包括:合并子模块,用于在所述文本行的所有连通域中,将满足连通域合并规则的连通域合并成合并区域;
非粘连字符
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于众安信息技术服务有限公司,未经众安信息技术服务有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711294411.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种LED字符自动定位方法
- 下一篇:一种车牌的倾斜角度检测方法及装置