[发明专利]用于验证码识别的分割方法和装置无效
申请号: | 201110287721.1 | 申请日: | 2011-09-26 |
公开(公告)号: | CN103020634A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 秦晓;吴於茜;康凯 | 申请(专利权)人: | 北京大学;北大方正集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T5/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 验证 识别 分割 方法 装置 | ||
技术领域
本发明涉及计算机图像处理技术领域,具体而言,涉及一种用于验证码识别的分割方法和装置。
背景技术
随着互联网技术的迅速发展,在为人们上网提供便利的同时也给黑客们提供了更广阔的操作空间,在线破解对网络安全的威胁越来越大。为了确保用户提交的请求是在线进行的正常操作,防止自动化程序的恶意行为,越来越多的网站如论坛类网站都采用了验证码技术,以保证服务器系统的稳定、用户信息的安全以及互联网的正常使用。
验证码是为区别对方到底是人还是计算机程序而设置的一种验证措施。其用途广泛,如可以防止Blog里的垃圾回复,保护网站注册,保护Email地址不被机器爬虫收集,在线调查,避免字典攻击等等。国内外很多网站的论坛在注册、登录或发帖部分都采用了验证码技术。验证码的另一个主要应用场所是电子邮件类网站,用来辅助预防和阻止垃圾邮件群发。总之,验证码技术在互联网中的使用已经非常普遍。
验证码有如下的特点:主要由数字、字母、汉字组成,有时还会出现韩文或日文,内容呈现随机性;可能由数字、字母或汉字的一种或几种组合而成,内容组合也呈现出随机性;验证码图片的颜 色多种多样,有的是彩色图片,有的则为黑白图片,呈现出颜色的随机性;验证码中包含2、4等不确定数量的字符,呈现出字符长度的随机性;验证码中存在干扰信息,而且这些干扰项是变化多样的,呈现出干扰信息的随机性;验证码中的字符位置多变,呈现出字符位置的随机性。
相关技术的验证码分割的方法主要包含以下几个步骤:
1、图像灰度化。选取一种灰度化算法,对图像进行灰度化处理,使图像中每个像素的R、G、B值相等,变成灰色。
2、图像二值化处理。采用自适应阈值法或者指定阈值法选取阈值,对于灰度化后的图像的每个像素的像素值进行二值化处理,取值0或者1,即图像的像素仅显示为黑白两种颜色。
3、图像梯度锐化处理。使图像中模糊的像素清晰化,同时也可以起到一定的去噪效果。图像锐化的方法有很多,如微分法、高通滤波法等。其中,一种锐化方法为Roberts梯度算子锐化法。定义如下:
设原始图像上的像素为f(x,y)。
定义f(x,y)在(x,y)处的梯度矢量为:
G[f(i,j)]=|f(i,i)-f(i+1,j)|+|f(i,j)-f(i,j+1)|
设一个判定阈值为Δ,变化后的图像g(x,y)定义为:
4、图像去噪处理,去除图像中的干扰信息,保留图像中的有效信息。噪声的添加对网络安全具有一定的维护作用,同时噪声信息也给验证码识别造成了一定的障碍。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司,未经北京大学;北大方正集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110287721.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:商品包装防伪装置、防伪识别装置及系统
- 下一篇:一种静电除尘的废极板粉碎机