[发明专利]一种混淆字符的验证码识别方法、装置及存储介质在审
申请号: | 201910275572.3 | 申请日: | 2019-04-08 |
公开(公告)号: | CN110070088A | 公开(公告)日: | 2019-07-30 |
发明(设计)人: | 王海洋;冯利光;李雪梅;刘大伟 | 申请(专利权)人: | 烟台中科网络技术研究所 |
主分类号: | G06K9/34 | 分类号: | G06K9/34;G06F17/22 |
代理公司: | 北京轻创知识产权代理有限公司 11212 | 代理人: | 王澎 |
地址: | 264003 山东省烟台*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 汉字 混淆 验证码 关系表 码字 存储介质 字体文件 渲染 字模 光学字符识别 使用安全性 下载 申请 图片 保证 | ||
本申请涉及一种混淆字符的验证码识别方法、装置及存储介质,该方法包括如下步骤:下载目标汉字的字体文件,并根据待识别的目标汉字从所述字体文件中提取出混淆汉字的字模和码字对应关系表,其中,所述码字对应关系表指示所述混淆汉字和所述目标汉字的对应关系,每个所述混淆汉字分别对应一个所述目标汉字;对所述混淆汉字的字模进行渲染,得到渲染图片;利用光学字符识别方法对所述渲染图片进行识别,得到所述混淆汉字;利用所述码字对应关系表识别出与所述混淆汉字对应的目标汉字。不仅可以保证了验证码的使用安全性,而且能有效提高验证码的识别效率和准确性。
技术领域
本发明涉及验证码识别领域,尤其涉及一种混淆字符的验证码识别方法、装置及存储介质。
背景技术
现有的验证码技术通常是采用分割单个字符后利用相似性匹配进行识别,这种识别方式需要很多的样本集作为基础,并且识别效率也会随样本大小变化而发生变化,且匹配算法的选择也存在多样性,这样就增加了破解方案的复杂度,如果降低了破解的复杂度,又会使得验证码的安全性得不到保障。另外,现有的验证码识别通常也会采用OCR技术,但是单独使用OCR技术进行识别,也会存在较大误差。
综上所述,现有的验证码识别技术存在识别过程复杂、识别准确率低、安全性较差等缺陷。
发明内容
本发明为了解决上述技术问题提供一种混淆字符的验证码识别方法。
本发明解决上述技术问题的技术方案如下:一种混淆字符的验证码识别方法,包括如下步骤:
下载目标汉字的字体文件,并根据待识别的目标汉字从所述字体文件中提取出混淆汉字的字模和码字对应关系表,其中,所述码字对应关系表指示所述混淆汉字和所述目标汉字的对应关系,每个所述混淆汉字分别对应一个所述目标汉字。
对所述混淆汉字的字模进行渲染,得到渲染图片。
利用光学字符识别方法对所述渲染图片进行识别,得到所述混淆汉字。
利用所述码字对应关系表识别出与所述混淆汉字对应的目标汉字。
本发明的有益效果是,通过预先将目标汉字与混淆汉字进行对应,建立码字关系对应表,其中,对应的目标汉字和混淆汉字分别为两个不同的汉字,再通过用混淆汉字的字模识别出混淆汉字后利用码字对应关系表对应得到验证码的目标汉字,有意将验证码中待识别的目标汉字通过另一个不同的汉字来对应识别,起到混淆作用,避免了直接对目标汉字进行识别而导致验证码容易被破解的问题,从而增加了验证码的破解难度,保证了验证码的使用安全性。其中,在通过字模识别混淆汉字时,先通过对所述混淆汉字的字模进行渲染,可以提高后续的识别准确率;而且通过利用深度学习算法训练汉字识别模型,并结合光学字符识别技术对多个渲染图片进行合成和识别,可以同时识别多个汉字,提高了识别效率,且避免不同条件下需选用不同匹配算法进行识别的复杂步骤。
在上述技术方案的基础上,本发明还可以做如下改进。
进一步,所述利用光学字符识别方法对所述渲染图片进行识别具体包括如下步骤:
对所述渲染图片进行图片处理,得到处理后的图片,其中,所述图片处理包括缩放、去污点、旋转。
建立汉字识别模型,利用深度学习算法训练所述汉字识别模型,得到训练后的汉字识别模型,并通过所述训练后的汉字识别模型对所述处理后的图片中的文字进行识别,得到所述混淆汉字。
进一步,所述对所述混淆汉字的字模进行渲染,得到渲染图片的具体实现如下:
利用python中的fonttools对所述混淆汉字的字模进行渲染,得到所述渲染图片。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于烟台中科网络技术研究所,未经烟台中科网络技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910275572.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图片识别方法及装置
- 下一篇:书法指导方法及装置、计算机设备及介质