[发明专利]基于深度学习的网络验证码识别方法、装置及计算机设备在审

专利信息
申请号: 201911179062.2 申请日: 2019-11-26
公开(公告)号: CN110909807A 公开(公告)日: 2020-03-24
发明(设计)人: 邱富根;王彪;刘龙辉;赵海诚 申请(专利权)人: 深圳市信联征信有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06N3/08;G06N3/04
代理公司: 深圳市精英专利事务所 44242 代理人: 巫苑明
地址: 518000 广东省深圳市南山区粤海街*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 学习 网络 验证 识别 方法 装置 计算机 设备
【说明书】:

发明涉及基于深度学习的网络验证码识别方法、装置及计算机设备,方法包括:获取待识别验证码数据;将待识别验证码数据输入至验证码识别模型内进行文字识别,以得到识别结果;判断识别结果是否正确;若识别结果为正确,则自动标注对应的验证码数据进入训练集与测试集;若识别结果不正确,则重新标注验证码数据,将自动标注的验证码数据与重新标注的验证码数据放入验证码识别模型进行重新训练,以更新验证码识别模型,直到验证码识别模型的识别率达到预设阈值后停止。通过取少量验证码数据作为验证码样本进行训练,并根据训练结果更新验证码识别模型,有效的减少了验证码识别模型训练/学习所需要的标注样本,同时提高模型识别精度。

技术领域

本发明涉及机器学习领域,更具体地说是指一种基于深度学习的网络验证码识别方法、装置及计算机设备。

背景技术

验证码(CAPTCHA)是“Completely Automated Public Turing test totellComputers and Humans Apart”(全自动区分计算机和人类的图灵测试)的缩写,是一种区分用户是计算机还是人的公共全自动程序。研究验证码识别技术则是人工智能的范畴,通过对验证码识别技术的研究,使机器能够达到人眼的识别效果,这对于人工智能的发展具有很大的推动作用。同时从事大数据分析的科研机构和科研人员需要获取网上大量的数据以进行科学研究,然而验证码的存在阻碍了数据的顺利获取,验证码识别技术的发展有利于摆脱这种困境,从而推动大数据分析相关技术的发展。

目前对验证码进行深度学习前,必须要有足够多的标注样本数目。在深度学习整个流程中,数据预处理占据这个项目流程的大部分时间。对于网络验证码,最常见的四位字母+数字组合,共有36^4=1679616种组合,对于扭曲粘连的无法切割的验证码,一种组合至少需要10张图片,那么所有样本至少需要1679616*10=16796160张图片,这样的标注工作量是巨大的,使用人工打码平台也需要耗费很大成本。如果样本量偏少,会大大影响模型识别准确率。

发明内容

本发明的目的在于克服现有技术的缺陷,提供一种基于深度学习的网络验证码识别方法、装置及计算机设备。

为实现上述目的,本发明采用以下技术方案:一种基于深度学习的网络验证码识别方法,包括以下步骤:

获取待识别验证码数据;

将待识别验证码数据输入至验证码识别模型内进行文字识别,以得到识别结果;

判断识别结果是否正确;

若识别结果为正确,则自动标注对应的验证码数据进入训练集与测试集;

若识别结果不正确,则重新标注验证码数据;

将自动标注的验证码数据与重新标注的验证码数据放入验证码识别模型进行重新训练,以更新验证码识别模型,直到验证码识别模型的识别率达到预设阈值后停止;

所述验证码识别模型是通过带标识的验证码数据作为样本数据训练卷积神经网络所得的。

进一步地,所述验证码识别模型是通过带标识的验证码数据作为样本数据训练卷积神经网络所得的,包括:

获取网站的部分验证码数据作为验证码样本;

将标注样本输入已有的卷积神经网络内进行训练,以得到样本输出结果;

将样本输出结果以及带标识的图像数据输入损失函数内,以得到损失值;

根据损失值调整卷积神经网络的参数;

利用样本数据且采用深度学习框架对卷积神经网络进行学习,以得到验证码识别模型。

进一步地,所述获取网站的部分验证码数据作为验证码样本的步骤,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市信联征信有限公司,未经深圳市信联征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911179062.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top