[发明专利]一种基于Gabor的计算机图像验证码识别算法在审
申请号: | 201610810107.1 | 申请日: | 2016-09-08 |
公开(公告)号: | CN107808155A | 公开(公告)日: | 2018-03-16 |
发明(设计)人: | 吴贤城 | 申请(专利权)人: | 吴贤城 |
主分类号: | G06K9/32 | 分类号: | G06K9/32;G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 51800*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 gabor 计算机 图像 验证 识别 算法 | ||
技术领域
本发明涉及计算机图像验证码识别领域,尤其设计一种通过Gabor滤波实现图像自动识别的技术及其方法。本发明包含两部分,第一部分为提取用于识别计算机图像验证码内容的特征集过程,第二部分为基于机器学习方法的计算机图像验证码识别模型的训练与识别过程。计算机图像验证码内容特征集的提取采用与人类视觉系统相似的二维离散Gabor滤波与计算机图像验证码做卷积后得到,采用不同的参数以得到不同的图像特征集,包括波长、相位、方向、高斯标准差和窗口比率等;基于机器学习的方法采用有监督学习的支持向量机方法实现,采用高斯径向基RBF核函数,根据已标识计算机图像验证码进行训练得到识别模型后,根据模型对未知计算机图像验证码内容进行识别。
背景技术
CAPTCHA(Completely Automated Public Turing test to tell Computers and Humans Apart)技术是一种广泛使用的用于区分人与机器的技术,该技术常见的形式是通过图像验证码来阻止非人类的访问。这类图像验证码一般采用增加扭曲、增加背景色、字符旋转和加入椒盐噪声等手段使得普通的图像识别算法无法正确识别图像内容。
发明内容
为了克服普通图像识别算法无法识别图像验证码的问题,本发明通过基于Gabor滤波的方法解决这一问题。Gabor变换在信号的时频分析中有着广泛的应用,而离散Gabor变换在图像处理中由于符合人类视觉系统的多分辨率多通信的特性也有较多的研究,研究发现二维的Gabor函数与人类脑部负责视觉系统的皮层接受野相似,因此可以通过Gabor滤波来有效地模仿人类视觉系统表示图像,进而可以应用在图像的纹理提取和图像识别等方面。二维的Gabor函数是由正统函数和高斯函数调制而成的,其表达式可以用公式表示如附图1。
图1公式为Gabor函数的复数形式,一般情况下我们只考虑其实值部分,如图2所示。
实值部分对应于频率于的幅值部分,其中参数λ表示波长,θ表示方向,φ对应于相移,σ为高斯函数的标准差, 对应于窗口的宽高比率。
将不同参数的Gabor滤波作用于验证码图像,获得图像的特征集,作为SVM的输入。
图像的识别可以划分为训练和分类两个过程。首先输入一批带标签的验证码,在对验证码图像进行预处理和Gabor变换后提取得到相应的图像特征,再将得到的特征集输入SVM训练器进行训练,将训练后得结果保存为识别模型。对未知的验证码进行识别时需要先载入训练好的模型,对图像进行同样的预处理操作和Gabor变换后将得到的图像特征输入SVM模型从而得到分类的结果即识别码。
附图说明
为了更清楚地说明本发明实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本发明的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
图3为基于Gabor的OCR算法处理流程;
图4为本发明实施过程中得到的部分特征图像;
图5为本发明实施的具体案例图像;
具体实施方式
下面将结合本发明实施例中的附图,对本发明实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本发明一部分实施例,而不是全部的实施例。基于本发明中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本发明保护的范围。
实施例1:
如图5所示,我们将首先获取足够量的图像验证码,通过人工标注的方法将图像验证码的内容进行标识并将整幅图像按字符切割成单个字符,保证每个字符都有足够量的对应图像验证码样本。将切割得到的图像通过二维离散Gabor滤波得到特征集Fλ,θ,φ,σ,γ,如图6所示。
其中*表示卷积乘。
不同的Gabor滤波参数代表不同的滤波效果,如λ参数表示二维Gabor的波长,用于模拟人眼对于图像识别的层次感。波长大,得到的将是图像的轮廓特征,波长小时,通过卷积得到的将是图像的细节特征。将不同Gabor参数得到特征集作为支持向量机的特征集输入,如图7所示。
Fi对应于第i组参数得到的特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于吴贤城,未经吴贤城许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610810107.1/2.html,转载请声明来源钻瓜专利网。
- 彩色图像和单色图像的图像处理
- 图像编码/图像解码方法以及图像编码/图像解码装置
- 图像处理装置、图像形成装置、图像读取装置、图像处理方法
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像解密方法、图像加密方法、图像解密装置、图像加密装置、图像解密程序以及图像加密程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序以及图像解码程序
- 图像编码方法、图像解码方法、图像编码装置、图像解码装置、图像编码程序、以及图像解码程序
- 图像形成设备、图像形成系统和图像形成方法
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序
- 图像编码装置、图像编码方法、图像编码程序、图像解码装置、图像解码方法及图像解码程序