[发明专利]一种基于经验模态分解与MFCC的声纹识别方法及装置在审
| 申请号: | 201910234983.8 | 申请日: | 2019-03-25 |
| 公开(公告)号: | CN109887510A | 公开(公告)日: | 2019-06-14 |
| 发明(设计)人: | 罗庆;包亚萍;徐振宇 | 申请(专利权)人: | 南京工业大学 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L25/24;G10L25/18;G10L25/21 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 211816 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 经验模态分解 声纹识别 特征参数 高速数据传输模块 计算机技术领域 数据采集模块 数据存储模块 算法实现模块 用户界面模块 语音信号处理 噪声鲁棒性 改善系统 身份认证 用户体验 语音信号 梅尔 融合 响应 改进 | ||
1.一种基于经验模态分解与MFCC的声纹识别方法,其特征在于,先对采集的语音信号进行梅尔特征参数提取,取39维梅尔特征参数,然后对预处理过后的语音信号进行经验模态分解,经过筛选之后得到与声纹信息有关的固有模态函数分量,对固有模态函数分量经希尔伯特分析提取瞬时特征参数,降维处理后与39维梅尔特征参数融合构成新的特征参数,用于声纹识别系统。
2.如权利要求1所述的方法,其特征在于,特征提取阶段具体步骤如下:
步骤1:梅尔特征参数提取,取13阶的梅尔倒谱参数,分别计算器一阶、二阶差分,组成39维特征参数;
步骤2:对预处理过后语音信号进行经验模态分解,筛选获取固有模态函数分量,通过限制从两个连续筛选结果计算的标准偏差SD的大小来停止筛选。SD通常取0.2-0.3;
步骤3:根据固有模态分量与语音信号之间的相关系数来剔除冗余的分量,获得与用户声纹信息相关的高阶分量;
步骤4:从选取的IMF分量中利用希尔伯特变换提取瞬时能量与瞬时频率,作为声纹识别系统的特征参数。其中H代表希尔伯特变换,fk(t)代表信号的瞬时频率,为信号的瞬时幅度平方;
步骤5:对提取的瞬时频率与瞬时能量(瞬时幅度平方代表瞬时能量)进行降维处理,AFk作为瞬时特征参数;
步骤6:将梅尔特征参数与瞬时特征参数经零均值化与方差归一化之后融合成新的特征参数。
3.一种声纹识别装置,其特征在于,所述装置包括:
数据采集模块,用于采集用户语音数据并进行预处理;
高速数据传输模块,用于高速传输语音等数据,并进行语音信号时域到频域转化的加速,即快速傅里叶变换的加速;
算法实现模块,用于对用户语音提取融合声纹特征及识别;
数据存储模块,用于保存语音数据,以及保存多个提取的特征以待调用;
用户界面模块,用于为非开发人员的操作使用提供便利。
4.如权利要求3所述的装置,其特征在于,数据采集模块据,包括:
采集子单元,用于获取用户输入的语音信号,采集时长可以设置;
预处理子单元,对语音信号进行预处理,同时进行基于能量的端点检测。
5.如权利要求3所述的装置,其特征在于,高速数据传输模块,包括:
传输子单元,高速数据传输总线协议;
加速子单元,用于对所述语音信号的快速傅里叶变换进行加速;
6.如权利要求3所述的装置,其特征在于,算法实现模块,包括:
第一计算子单元,用于计算语音信号的梅尔倒谱特征参数;
第二计算子单元,用于计算语音信号的瞬时特性参数;
融合单元,用于融合第一计算单元与第二计算单元的特征参数作为用户唯一特征标识;
判别单元,用于判定当前采集声纹特征所属用户身份。
7.如权利要求3所述的装置,其特征在于,数据存储模块,包括:
文件系统单元,用于保存不同用户的数据以及系统的重复高效运行;
8.如权利要求3所述的装置,其特征在于,用户界面模块,包括:
语音唤醒开关单元,检测到达到阈值的声音时自动唤醒系统;
用户界面单元,用于用户进行简单有效的声纹识别操作。
9.一种硬件设备,包括处理器、硬化加速器、存储器和操作系统,其特征在于,所述设备执行所述程序与指令时实现如权利要求1-2任一所述的声纹识别方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京工业大学,未经南京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910234983.8/1.html,转载请声明来源钻瓜专利网。





