[发明专利]用于验证码识别的分割方法和装置无效
申请号: | 201110287721.1 | 申请日: | 2011-09-26 |
公开(公告)号: | CN103020634A | 公开(公告)日: | 2013-04-03 |
发明(设计)人: | 秦晓;吴於茜;康凯 | 申请(专利权)人: | 北京大学;北大方正集团有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06T5/00 |
代理公司: | 北京英赛嘉华知识产权代理有限责任公司 11204 | 代理人: | 王达佐 |
地址: | 100871*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 验证 识别 分割 方法 装置 | ||
1.一种用于验证码识别的分割方法,其特征在于,包括:
获取验证码图像;
对所述验证码图像进行聚类处理,得到多个类簇图像;
从所述多个类簇图像中筛选得到目标图像。
2.根据权利要求1所述的方法,其特征在于,获取验证码图像包括:
从网页中提取包含验证码的图片;
将所述图片转换为点阵数据格式,得到所述验证码图像。
3.根据权利要求1所述的方法,其特征在于,对所述验证码图像进行聚类处理包括:
在所述验证码图像中选取一个像素作为聚类中心;
确定所述验证码图像的每个像素的颜色值与所述聚类中心的颜色值的距离;
以所述距离执行聚类运算,得到所述多个类簇图像。
4.根据权利要求3所述的方法,其特征在于,以所述距离执行聚类运算包括:
扫描所述验证码图像中的像素;
如果当前的所述像素的所述距离不大于阈值,则将当前的所述像素添加到当前的聚类中心的像素集合中;否则,将当前的所述像素作为一个新的聚类中心;
循环执行上述步骤,直到扫描完所述验证码图像中的所有像素;
将像素个数大于预设值的所述像素集合保存为所述类簇图像。
5.根据权利要求1所述的方法,其特征在于,从所述多个类簇图像中筛选得到目标图像包括:
将所述多个类簇图像中宽度小于所述验证码图像的第一百分比,且高度小于所述验证码图像的第二百分比的类簇图像,确定为所述目标图像。
6.根据权利要求5所述的方法,其特征在于,调整所述第一百分比和所述第二百分比的值,使得所述目标图像的个数为预定个数且所述目标图像包含所述验证码。
7.根据权利要求6所述的方法,其特征在于,还包括:
以所述多个目标图像的最左边界线的值从小到大,将所述多个目标图像排序;
对各个所述目标图像进行膨胀和腐蚀处理;
去除各个所述目标图像的左右边界和上下边界之外的区域;
对去除处理之后的各个所述目标图像进行大小变换处理,使得各个所述目标图像的大小一致。
8.根据权利要求1所述的方法,其特征在于,还包括以下至少一个步骤:
在对所述验证码图像进行聚类处理之前,对所述验证码图像进行去噪处理;
在从所述多个类簇图像中筛选得到目标图像之前,对所述多个类簇图像进行二值化处理。
9.一种用于验证码识别的分割装置,其特征在于,包括:
获取模块,用于获取验证码图像;
聚类模块,用于对所述验证码图像进行聚类处理,得到多个类簇图像;
筛选模块,用于从所述多个类簇图像中筛选得到目标图像。
10.根据权利要求9所述的装置,其特征在于,所述筛选模块包括:
选取模块,用于在所述验证码图像中选取一个像素作为聚类中心;
距离模块,用于确定所述验证码图像的每个像素的颜色值与所述聚类中心的颜色值的距离;
运算模块,用于以所述距离执行聚类运算,得到所述多个类簇图像。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学;北大方正集团有限公司,未经北京大学;北大方正集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110287721.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:商品包装防伪装置、防伪识别装置及系统
- 下一篇:一种静电除尘的废极板粉碎机