[发明专利]组合验证码的分割识别方法及其系统有效
申请号: | 201810447286.6 | 申请日: | 2018-08-09 |
公开(公告)号: | CN108875745B | 公开(公告)日: | 2021-11-19 |
发明(设计)人: | 吴志祥;张海龙;王专;马和平;吴剑;陈文;祁猛 | 申请(专利权)人: | 同程网络科技股份有限公司 |
主分类号: | G06K9/34 | 分类号: | G06K9/34 |
代理公司: | 南京苏科专利代理有限责任公司 32102 | 代理人: | 姚姣阳 |
地址: | 215123 江苏省苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 组合 验证 分割 识别 方法 及其 系统 | ||
本发明揭示了一种组合验证码的分割识别方法,包括步骤:对原图进行RGB三通道分离,并选取G通道成像;对选取G通道成像进行二值化处理和3*3作为核的开操作,得到二值字符图像;统计白色连通域,设定连通域阀值判断所述二值字符图形为黑色背景或白色背景;根据连通域统计值的不同范围,进行连通域X轴排序并计算连通域间隔最大的X轴位置,截取以词为单位的整片图像;对截取图像进行均衡化、二值化处理,输出基于词组分割的图片;对输出图片进行训练、识别。应用本发明组合验证码的分割识别方案,通过改良图像分割的基本框架,使图像的单位颗粒和训练对象都从单纯的汉字转为以汉字为基础的词组,采用同一套算法能满足解决四类词组图片的切割和识别。
技术领域
本发明涉及图像处理领域,尤其涉及一种字符组合验证码的分割识别方法及其系统。
背景技术
验证码的识别经过长时间的发展,其识别方法可分为三大类:以统计特征为基础的识别方法、以结构特征为基础的识别方法和以人工智能领域的多种机器学习方法相结合为基础的识别方法。
而在众多的验证码形式中,数字、图像、文字及其组合的验证码当前最为常用。尤其其中的文字组合,对于当前处理此类验证码,一般采用常规图形学算法对图片进行预处理,最后会形成一个有效信息和底部背景有明显的对比度,对图片中汉字进行切割,将每个汉字词组都切割成单独的汉字个体,再通过已经成熟的汉字识别模型(Tesseract-OCR)或者深度学习算法对汉字进行识别,最后再对汉字进行组合成词组,对图片进行选取。
现有技术的主要问题就是对问题中每个汉字进行单独识别,少了词组的概念,但是在此类问题中,单个汉字是没有意义的,并且在现有的成熟的算法模型中对于特殊的不通用的字体汉字的支持效果不是很好,所以对即将需要识别的汉字的正确率也存在一定的不定性因素。
发明内容
本发明的目的旨在提出一种组合验证码的分割识别方法及其系统,解决验证码图片分割词汇、训练和识别的问题。
为解决上述技术问题,本发明提供一种组合验证码的分割识别方法,其特征在于包括:
对原图进行RGB三通道分离,并选取G通道成像;
对选取G通道成像进行二值化处理和3*3作为核的开操作,得到二值字符图像;
统计白色连通域,设定连通域阀值判断所述二值字符图形为黑色背景或白色背景;
根据连通域统计值的不同范围,进行连通域X轴排序并计算连通域间隔最大的X轴位置,截取以词为单位的整片图像;
对截取图像进行均衡化、二值化处理,输出基于词组分割的图片;
对输出图片进行训练、识别。
进一步地,所述连通域阀值作为连通域统计值满足条件的判断依据,对于满足条件的判定为黑色背景且连通区域为组合验证码的有效信息部分;对于未满足条件的判定为白色背景。
更进一步地,对于连通域统计值为2以上,直接进行连通域X轴排序并计算各连通域的间隔,找出X轴向间隔最大的点位,并以所述点位为界截取以词为单位的整片图像。
更进一步地,对于连通域统计值等于1,计算连通域X轴向左右两侧的位点,并以所述位点为界截取以词为单位的整片图像。
更进一步地,对于连通域统计值小于1,再次二值化、闭运算、连通域统计,而后进行连通域X轴排序、移除、纵向合并,再计算各连通域的间隔,找出X轴向间隔最大的点位,并以所述点位为界截取以词为单位的整片图像。
为解决上述技术问题,本发明提供一种组合验证码的分割识别系统,其特征在于包括:
预处理模块,对原图进行RGB三通道分离,并选取G通道成像;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同程网络科技股份有限公司,未经同程网络科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810447286.6/2.html,转载请声明来源钻瓜专利网。