[发明专利]一种基于振幅和相位信息的录音攻击检测方法在审

专利信息
申请号: 201910087807.6 申请日: 2019-01-29
公开(公告)号: CN109935233A 公开(公告)日: 2019-06-25
发明(设计)人: 王龙标;刘猛;党建武 申请(专利权)人: 天津大学
主分类号: G10L17/00 分类号: G10L17/00;G10L17/02;G10L17/04;G10L25/24
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 程小艳
地址: 300072*** 国省代码: 天津;12
权利要求书: 暂无信息 说明书: 暂无信息
摘要: 发明公开了一种融合多分辨率振幅和相位信息的录音欺诈检测方法,包括以下步骤:步骤一,选择声纹欺诈检测数据库,进行输入数据准备;步骤二,分别提取振幅和相位信息,采用多分辨率振幅及相位特征提取方法;步骤三,分类模型训练,利用步骤二特征进行区分度模型训练;步骤四,特征融合,充分利用振幅相位特征的互补性;最后,判别决策,输出录音回放分类结果。本发明的录音攻击检测方法和现有技术相比,考虑到了语音的相位信息,融合录音回放检测相位振幅相关特征,大大的提高了特征的丰富性,获得更好录音攻击检测效果。通过提取多分辨率的振幅与相位信息,有效利用了相位与振幅的互补性,以及相同特征在不同频段的互补性。
搜索关键词: 相位信息 录音 多分辨率 攻击检测 欺诈检测 互补性 回放 分类模型训练 输入数据准备 相位特征提取 分类结果 模型训练 特征融合 相位振幅 振幅相位 区分度 融合 频段 声纹 数据库 语音 输出 检测 决策
【主权项】:
1.一种基于振幅和相位信息的录音攻击检测方法,其特征在于,包括以下步骤:步骤一,输入数据准备:对录音回放数据库中的语音信号进行数据准备,划分训练集、验证集、测试集;步骤二,特征提取:1)振幅信息提取:对语音信号分帧、加窗、短时傅里叶变换,针对不同频段采用不同分辨率,提出多种分辨率的振幅特征提取方法;2)相位信息提取:基于相对相位提取每一段语音对应的相位信息,针对不同频段分辨率提出多种分辨率的相位特征提取方法;步骤三,分类模型训练:将训练集中录音回放音频和原始声音特征提取后分别作为输入,训练两个Gaussian Mixture Model分类器,GMMgenuine和GMMspoof;步骤四,特征融合:对于多分辨率的相位特征和振幅特征分别进行判别决策后,在打分层面进行特征融合,采用线性打分特征融合:L=(1‑α)L1+αL2,      (1)其中L表示最终打分结果,L1对应相位特征打分结果,L2对应振幅特征打分结果,α表示权重系数,通过验证集打分结果进行确定;步骤五,判别决策:对于要检测是否为回放录音的测试音频,经过特征提取后,通过计算被测试音频与GMMgenuine和GMMspoof似然相似度,最终进行决策评分:若与GMMgenuine更为相似则判定为原始音频;若与GMMspoof具有更高相似度,则为回放音频。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910087807.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top