[发明专利]一种基于振幅和相位信息的录音攻击检测方法在审
申请号: | 201910087807.6 | 申请日: | 2019-01-29 |
公开(公告)号: | CN109935233A | 公开(公告)日: | 2019-06-25 |
发明(设计)人: | 王龙标;刘猛;党建武 | 申请(专利权)人: | 天津大学 |
主分类号: | G10L17/00 | 分类号: | G10L17/00;G10L17/02;G10L17/04;G10L25/24 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明公开了一种融合多分辨率振幅和相位信息的录音欺诈检测方法,包括以下步骤:步骤一,选择声纹欺诈检测数据库,进行输入数据准备;步骤二,分别提取振幅和相位信息,采用多分辨率振幅及相位特征提取方法;步骤三,分类模型训练,利用步骤二特征进行区分度模型训练;步骤四,特征融合,充分利用振幅相位特征的互补性;最后,判别决策,输出录音回放分类结果。本发明的录音攻击检测方法和现有技术相比,考虑到了语音的相位信息,融合录音回放检测相位振幅相关特征,大大的提高了特征的丰富性,获得更好录音攻击检测效果。通过提取多分辨率的振幅与相位信息,有效利用了相位与振幅的互补性,以及相同特征在不同频段的互补性。 | ||
搜索关键词: | 相位信息 录音 多分辨率 攻击检测 欺诈检测 互补性 回放 分类模型训练 输入数据准备 相位特征提取 分类结果 模型训练 特征融合 相位振幅 振幅相位 区分度 融合 频段 声纹 数据库 语音 输出 检测 决策 | ||
【主权项】:
1.一种基于振幅和相位信息的录音攻击检测方法,其特征在于,包括以下步骤:步骤一,输入数据准备:对录音回放数据库中的语音信号进行数据准备,划分训练集、验证集、测试集;步骤二,特征提取:1)振幅信息提取:对语音信号分帧、加窗、短时傅里叶变换,针对不同频段采用不同分辨率,提出多种分辨率的振幅特征提取方法;2)相位信息提取:基于相对相位提取每一段语音对应的相位信息,针对不同频段分辨率提出多种分辨率的相位特征提取方法;步骤三,分类模型训练:将训练集中录音回放音频和原始声音特征提取后分别作为输入,训练两个Gaussian Mixture Model分类器,GMMgenuine和GMMspoof;步骤四,特征融合:对于多分辨率的相位特征和振幅特征分别进行判别决策后,在打分层面进行特征融合,采用线性打分特征融合:L=(1‑α)L1+αL2, (1)
其中L表示最终打分结果,L1对应相位特征打分结果,L2对应振幅特征打分结果,α表示权重系数,通过验证集打分结果进行确定;步骤五,判别决策:对于要检测是否为回放录音的测试音频,经过特征提取后,通过计算被测试音频与GMMgenuine和GMMspoof似然相似度,最终进行决策评分:若与GMMgenuine更为相似则判定为原始音频;若与GMMspoof具有更高相似度,则为回放音频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910087807.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种声学标识码及其编码识别方法
- 下一篇:一种对录音鉴定来源设备的方法