[发明专利]一种语音对抗样本识别模型训练方法及系统在审
申请号: | 202210095222.0 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114550704A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 徐文渊;冀晓宇;程雨诗;何睿文;高逸卓 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L25/18 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 对抗 样本 识别 模型 训练 方法 系统 | ||
本发明公开了一种语音对抗样本识别模型训练方法及系统,属于对抗样本识别领域。包括:获取音频数据集,包含正常和对抗音频数据;获取每一个音频数据在一定频率范围的频谱图,生成频谱特征;计算不同频率范围下的所有音频数据的Fratio值和Fratio累计值,得到关于采样频率的Fratio累计值的单调递增曲线f;根据单调递增曲线f设计滤波器组,并对音频数据集中的所有音频进行滤波操作;利用滤波后的音频数据集对语音对抗样本识别模型进行训练。本发明通过设计的滤波器组放大了正常音频数据与对抗音频数据的关键差异部分,为对抗样本的识别提供了新方法,且模型训练简单,在较少的训练代价下,具备较高的识别精度。
技术领域
本发明涉及对抗样本识别领域,尤其涉及一种语音对抗样本识别模型训练方法及系统。
背景技术
随着人工智能技术的不断发展,越来越多的基于人工智能技术的应用被广泛使用在了生活中,包括语音内容识别、智能助手等等。这类基于人工智能模型来处理业务需求的方法却拥有脆弱性,容易遭受语音对抗样本的攻击。语音对抗样本是一种在原始音频上叠加一个人耳难以察觉的扰动,造成人工智能模型识别的结果出错的一种攻击方式。
现有的识别语音对抗样本的方法大多是利用正常样本和对抗样本在时域或者频域上的微小差别进行的。但由于微小差异难以捕捉,直接使用深度学习网络的方式进行容易出现模型的训练成本过大的问题。
发明内容
本发明为了解决上述技术问题,提供了一种语音对抗样本识别模型训练方法及系统,通过利用音频数据的Fratio累计值设计滤波器组,放大了正常音频和对抗音频间的微小差距,使得模型训练的代价减小,训练速度快,精度高。
为实现上述目的,本发明的第一个目的在于提供一种语音对抗样本识别模型训练方法,包括:
步骤1:获取音频数据集,所述的音频数据集包含正常音频数据与对抗音频数据;
步骤2:设计音频的采样频率,得到音频数据集中每一个音频数据在(0-m)频率范围的频谱图,根据离散的采样点生成频谱特征;m表示采样频率范围的最大值;
步骤3:计算不同频率范围下的所有音频数据的Fratio值和Fratio累计值,得到关于采样频率的Fratio累计值的单调递增曲线f;
步骤4:根据单调递增曲线f设计滤波器组,并对音频数据集中的所有音频进行滤波操作;
步骤5:利用滤波后的音频数据集对语音对抗样本识别模型进行训练。
进一步的,所述的采样频率范围为0-16k。
进一步的,所述的Fratio值的计算公式为:
其中,表示第i类中第j个音频的频谱特征,j=1,2,…,N,N表示音频数据集中第i类的音频数量,i=1,2,分别对应正常类和对抗类;ui表示第i类中N个音频的频谱特征的均值,u表示全部音频的频谱特征的均值。
进一步的,所述的单调递增曲线f具体为:
在(0-m)频率范围内设置不同的采样频率(m1,m2,…,mi,…,mn),获取在(0-mi)频率范围的频谱图,计算该频率范围下的所有音频数据的Fratio值,记作所述的Fratio累计值为
遍历所有的(0-mi)频率范围组合,得到不同频率范围下的所有音频数据的Fratio累计值,构成关于频率的单调递增曲线f。
进一步的,所述的滤波器组的设计方法为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210095222.0/2.html,转载请声明来源钻瓜专利网。