[发明专利]基于生成对抗网络的语音验证码生成方法有效
申请号: | 202011159897.4 | 申请日: | 2020-10-27 |
公开(公告)号: | CN112287323B | 公开(公告)日: | 2022-10-21 |
发明(设计)人: | 高海昌;王萍;袁忠妮;郭晓妍 | 申请(专利权)人: | 西安电子科技大学 |
主分类号: | G06F21/36 | 分类号: | G06F21/36;G06N3/04;G06N3/08 |
代理公司: | 陕西电子工业专利中心 61205 | 代理人: | 陈宏社;王品华 |
地址: | 710071*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 生成 对抗 网络 语音 验证 方法 | ||
本发明公开了一种基于生成对抗网络的语音验证码生成方法,旨在通过增强抵御自动语音识别系统攻击的能力,提高语音验证码的安全性,实现步骤为:获取训练样本集、测试样本集和帧序列集;构建语音验证码生成网络模型;对语音验证码生成网络模型进行迭代训练;获取语音验证码的生成结果。本发明利用人耳不易觉察对抗扰动噪声可以使自动语音识别系统误分类的特性,将用包含生成对抗网络的模型生成的对抗扰动噪声添加到原始语音验证码的音频文件中,并通过生成对抗网络交替训练互相博弈的过程,使生成的带有对抗扰动噪声的语音验证码难以被自动语音识别系统攻击成功,从而提高语音验证码的安全性,可用于实际场景中的验证码验证过程。
技术领域
本发明属于网络安全技术领域,涉及一种语音验证码生成方法,特别涉及一种利用包含生成对抗网络GAN的模型生成语音验证码的方法,可用于网络安全验证。
背景技术
验证码,即全自动区分计算机和人类的公开图灵测试(Completely AutomatedPublic Turing test to tell Computers and Humans Apart,CAPTCHA),是一种区分用户是计算机还是人的公共自动程序,主要通过强制人机交互来抵抗来自机器的恶意攻击。现如今,注册账号和登陆网站都需要验证码,验证码不仅能保护隐私安全、防止信息被恶意盗取,更能减少一些不必要的损失。现在比较主流的验证码包括文本验证码、图像验证码和语音验证码。语音验证码作为验证码的主流方式之一,主要形式以一段音频文件播放为主,通过用户完成听力识别音频内容完成验证过程,其出现为视觉障碍人群带来了福音。同时,作为一种以音频识别为主要任务的机制,扩充了验证码的多样性,增大了验证码自动识别的难度。近年来,随着语音识别技术取得突破性成果以及语音相关应用的普及,语音验证码也应该被重视起来。
现有大多数语音验证码已被证实可被自动语音识别系统攻破,且攻击成功率较高,其安全性亟需提高。目前影响语音验证码的安全性的因素主要可以分为两个方面:(1)语音验证码中音频自身的属性,例如语速、内容的难易程度、背景噪声等,语速越快、验证码中内容越难、噪声越大,语音验证码越不易被破解,但与此同时,人类通过语音验证码的难度也随之提升;(2)在语音验证码中加入的一些防御自动语音识别系统攻击的机制,这些加入的机制较大程度提高验证码的安全性的同时往往可以使人类难以察觉。现有的语音验证码一般是通过改变第一个方面的内容来提高安全性,例如从新闻等现实场景截取带有背景噪声的语音片段或者选择语速快的语音片段作为语音验证码。
在现今已有语音验证码中,抵御性较强的有Google于2014年提出并沿用的reCAPTCHA v2中的语音验证码,该语音验证码通过两端添加的噪声片段和一些背景噪声来抵御机器的恶意攻击,然而,验证码附带的背景噪声较容易被人类听众觉察且没有利用自动语音识别系统等机器攻击的特性来增加一些防御机制。用目前较好的Deepspeech和Lingvo自动语音识别模型对reCAPTCHA v2中的语音验证码进行识别,这些语音验证码大部分可被正确识别。
发明内容
本发明的目的在于针对上述现有技术存在的不足,提出了一种基于生成对抗网络的语音验证码生成方法,旨在通过增强抵御自动语音识别系统攻击的能力,提高语音验证码的安全性。
为实现上述目的,本发明采取的技术方案包括如下步骤:
(1)获取训练样本集、测试样本集和帧序列集:
(1a)从第三方开源平台获取N个原始语音验证码的音频文件,若音频文件的格式不是wav,则将其格式转换为wav,并对每个wav格式的音频文件首尾的噪音部分进行裁剪,得到音频文件集X={X1,X2,...,Xn,...,XN},其中N≥1200,Xn表示第n个裁剪后的长度为Ln的音频文件;
(1b)任选I个音频文件作为训练样本集,将其余N-I个音频文件作为测试样本集,其中
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安电子科技大学,未经西安电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011159897.4/2.html,转载请声明来源钻瓜专利网。