[发明专利]一种基于多路径网络的说话人确认欺骗检测方法在审

申请号：	202211055454.X	申请日：	2022-08-31
公开（公告）号：	CN115424625A	公开（公告）日：	2022-12-02
发明（设计）人：	雷震春;周勇	申请（专利权）人：	江西师范大学
主分类号：	G10L17/26	分类号：	G10L17/26;G10L17/04;G10L19/16;G10L25/24
代理公司：	北京盛询知识产权代理有限公司 11901	代理人：	张焱
地址：	330022 ***	国省代码：	江西;36
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于路径网络说话确认欺骗检测方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于多路径网络的说话人确认欺骗检测方法，其特征在于，包括以下步骤：

S1、获取说话人真实语音数据及欺骗语音数据作为原始语音数据，并对所述原始语音数据分别进行PCM-alaw编解码和PCM-mulaw编解码，得到PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据；

S2、分别计算所述原始语音数据、所述PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据的线性频率倒谱系数特征；

S3、将所述原始语音数据、所述PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据视为来自不同域的语音数据，采用单独的高斯混合模型对所述原始语音数据、所述PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据的线性频率倒谱系数特征分别进行建模，并分别在所述不同域的语音数据上进行训练，得到针对不同域的高斯混合模型，包括原始语音高斯混合模型、PCM-alaw语音高斯混合模型和PCM-mulaw语音高斯混合模型；

S4、将所述原始语音数据、所述PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据的线性频率倒谱系数特征同时作为原始语音高斯混合模型、PCM-alaw语音高斯混合模型和PCM-mulaw语音高斯混合模型的输入，分别计算得到基于原始语音高斯混合模型、PCM-alaw语音高斯混合模型、PCM-mulaw语音高斯混合模型的概率特征；

S5、构建多路径GMM-MobileNet网络，将基于所述原始语音高斯混合模型、PCM-alaw语音高斯混合模型、PCM-mulaw语音高斯混合模型的概率特征分别作为各自MobileNet网络路径的输入，对所述多路径GMM-MobileNet网络进行训练，训练好的多路径GMM-MobileNet网络模型用于对新的语音数据进行欺骗检测。

2.根据权利要求1所述的一种基于多路径网络的说话人确认欺骗检测方法，其特征在于，所述S2包括：

S2.1、分别对所述原始语音数据、PCM-alaw编解码语音数据和PCM-mulaw编解码语音数据进行语音信号预加重；

S2.2、将所述预加重后的语音数据分成若干短时语音帧；

S2.3、采用汉明窗函数对每帧语音数据进行加窗处理，得到短时加窗的语音信号；

S2.4、将所述短时加窗的语音信号进行傅里叶变换得到频域信号，并计算频域信号的能量谱；

S2.5、采用三角滤波器对所述能量谱进行滤波，并对滤波后的输出进行离散余弦变换，得到初始线性频率倒谱系数特征；

S2.6、提取所述初始线性频率倒谱系数特征的动态差分参数，并与初始线性频率倒谱系数特征进行合并，得到最终的所述线性频率倒谱系数特征。

3.根据权利要求2所述的一种基于多路径网络的说话人确认欺骗检测方法，其特征在于，所述S2.2中，采用重叠取帧的方式进行语音分帧。

4.根据权利要求1所述的一种基于多路径网络的说话人确认欺骗检测方法，其特征在于，所述原始语音高斯混合模型、PCM-alaw语音高斯混合模型、PCM-mulaw语音高斯混合模型都采用期望最大方法进行训练。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于江西师范大学，未经江西师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】