[发明专利]一种语音对抗样本识别模型训练方法及系统在审
申请号: | 202210095222.0 | 申请日: | 2022-01-26 |
公开(公告)号: | CN114550704A | 公开(公告)日: | 2022-05-27 |
发明(设计)人: | 徐文渊;冀晓宇;程雨诗;何睿文;高逸卓 | 申请(专利权)人: | 浙江大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/02;G10L25/18 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 郑海峰 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 对抗 样本 识别 模型 训练 方法 系统 | ||
1.一种语音对抗样本识别模型训练方法,其特征在于,包括:
步骤1:获取音频数据集,所述的音频数据集包含正常音频数据与对抗音频数据;
步骤2:设计音频的采样频率,得到音频数据集中每一个音频数据在(0-m)频率范围的频谱图,根据离散的采样点生成频谱特征;m表示采样频率范围的最大值;
步骤3:计算不同频率范围下的所有音频数据的Fratio值和Fratio累计值,得到关于采样频率的Fratio累计值的单调递增曲线f;
步骤4:根据单调递增曲线f设计滤波器组,并对音频数据集中的所有音频进行滤波操作;
步骤5:利用滤波后的音频数据集对语音对抗样本识别模型进行训练。
2.根据权利要求1所述的语音对抗样本识别模型训练方法,其特征在于,所述的采样频率范围为0-16k。
3.根据权利要求1所述的语音对抗样本识别模型训练方法,其特征在于,所述的Fratio值的计算公式为:
其中,表示第i类中第j个音频的频谱特征,j=1,2,…,N,N表示音频数据集中第i类的音频数量,i=1,2,分别对应正常类和对抗类;ui表示第i类中N个音频的频谱特征的均值,u表示全部音频的频谱特征的均值。
4.根据权利要求3所述的语音对抗样本识别模型训练方法,其特征在于,所述的单调递增曲线f具体为:
在(0-m)频率范围内设置不同的采样频率(m1,m2,...,mi,...,mn),获取在(0-mi)频率范围的频谱图,计算该频率范围下的所有音频数据的Fratio值,记作所述的Fratio累计值为
遍历所有的(0-mi)频率范围组合,得到不同频率范围下的所有音频数据的Fratio累计值,构成关于频率的单调递增曲线f。
5.根据权利要求1所述的语音对抗样本识别模型训练方法,其特征在于,所述的滤波器组的设计方法为:
将单调递增曲线f的值域等分为M个标志点,每一个标志点对应一个频率点,该频率点即为滤波器的中心频率点,得到一组滤波器中心点向量为:
其中,Max表示单调递增曲线f的值域最大值;(Ci,1)表示第i个滤波器的中心点,该中心点与相邻两点(Ci-1,0)和(Ci+1,0)相连,即可得到一个三角滤波器;遍历Ci,i=1,2,,M,得到M个三角滤波器。
6.根据权利要求1所述的语音对抗样本识别模型训练方法,其特征在于,将音频数据集中的所有音频的频谱特征和滤波器组进行卷积计算,实现滤波器组对音频的滤波操作。
7.一种语音对抗样本识别系统,其特征在于,包括:
音频预处理模块,其采用权利要求1所述的语音对抗样本识别模型训练方法得到的滤波器组,对音频数据集中的所有音频进行滤波操作;
对抗样本识别模块,其用于将滤波后的待识别音频数据作为输入,得到该音频的判别分数;
识别结果展示模块,其用于将判别分数与阈值进行比较,若高于阈值,则发出警报提示检测到对抗音频,并在系统界面上进行可视化展示。
8.根据权利要求7所述的语音对抗样本识别系统,其特征在于,所述的音频预处理模块包括:
音频数据集获取模块,其用于获取待识别的音频数据集;
频域变换模块,其用于将待识别的音频数据集中的音频数据进行频域变换得到频谱图,根据离散的采样点生成频谱特征;
滤波模块,其用于将频谱特征与权利要求1得到的滤波器组进行卷积计算,得到滤波后的待识别音频数据。
9.根据权利要求7所述的语音对抗样本识别系统,其特征在于,所述的对抗样本识别模块为权利要求1训练好的语音对抗样本识别模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210095222.0/1.html,转载请声明来源钻瓜专利网。