[发明专利]基于MFCC和向量元学习的声纹识别方法在审

专利信息
申请号: 202011220705.6 申请日: 2020-11-05
公开(公告)号: CN112397074A 公开(公告)日: 2021-02-23
发明(设计)人: 林科;满瑞 申请(专利权)人: 桂林电子科技大学
主分类号: G10L17/02 分类号: G10L17/02;G10L17/18;G10L17/04;G10L25/24;G10L17/08
代理公司: 桂林市华杰专利商标事务所有限责任公司 45112 代理人: 杨雪梅
地址: 541004 广西*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 mfcc 向量 学习 声纹 识别 方法
【权利要求书】:

1.基于MFCC和向量元学习的声纹识别方法,其特征在于,包括:

语音预处理:录制语音信号,得到语音数据集,将语音数据集分为训练集和测试集,然后将语音数据集内的所有语音信号进行语音数据增强和语音预加重处理;

特征提取步骤:采用MFCC对语音预处理后的训练集中的语音信号进行特征提取,得到MFCC特征参数;

模型训练步骤:将训练集语音信号的MFCC特征参数输入原型网络中进行模型训练;

模式匹配步骤:从测试集待识别语音信号中提取MFCC特征参数,输入训练好的原型网络中计算,使用欧几里得距离作为距离度量,被识别语音所提取的特征量必须与训练得到的每个人的模型特征参数进行比较,找到相似度最近的那个作为辨认的结果。

2.根据权利要求1所述的基于MFCC和向量元学习的声纹识别方法,其特征在于,所述语音预处理包括:

语音数据增强步骤:通过SEEED的语音采集板采集人们平时说话的语音信号,通过praat软件对采集的语音信号正向播放、倒向播放和随机删减部分片段,来对语音信号进行增强操作;

语音预加重:将语音信号通过一个高通滤波器,提升高频部分,使信号的频谱变得平坦,保持在低频到高频的整个频带中,能用同样的信噪比求频谱,同时消除发声过程中声带和嘴唇的效应,来补偿语音信号受到发音系统所抑制的高频部分,突出高频的共振峰。

3.根据权利要求1所述的基于MFCC和向量元学习的声纹识别方法,其特征在于,所述特征提取步骤包括:

预加重子步骤:将语音信号通过滤波器提升高频部分;

分帧子步骤:对预加重后的语音信号进行分帧;

汉明窗子步骤:将分帧后的语音信号的每帧乘以汉明窗;

快速傅里叶变换子步骤:对汉明窗后的每一帧语音信号进行快速傅里叶变换,得到能量谱;

三角带通滤波子步骤:将能量谱输入三角带通滤波器组,平滑化频谱,消除谐波的作用,突显原先语音的共振峰;

对数能量计算子步骤:计算每个三角带通滤波器输出的对数能量;

离散余弦变换子步骤:将计算得到的对数能量代入离散余弦变换,得到MFCC特征参数;

动态差分参数子步骤:通过MFCC的差分谱来表示语音信号的动态特性,得到多维MFCC特征参数。

4.根据权利要求3所述的基于MFCC和向量元学习的声纹识别方法,其特征在于,所述预加重子步骤包括:

H(Z)=1-μz-1 (1),

其中,μ的值介于0.9-1.0之间,Z为预加重之后的语音信号,z为预加重之前的语音信号。

5.根据权利要求3所述的基于MFCC和向量元学习的声纹识别方法,其特征在于,所述分帧子步骤包括:

先将N个采样点集合成一个观测单位,称为帧,通常情况下N的值为256或512,涵盖的时间约为20~30ms,为了避免相邻两帧的变化过大,因此会让两相邻帧之间有一段重叠区域,此重叠区域包含了M个取样点,通常M的值约为N的1/2或1/3,通常语音识别所采用语音信号的采样频率为8KHz或16KHz,以8KHz来说,若帧长度为256个采样点,则对应的时间长度是256/8000×1000=32ms。

6.根据权利要求3所述的基于MFCC和向量元学习的声纹识别方法,其特征在于,所述汉明窗子步骤包括:

将每一帧乘以汉明窗,以增加帧左端和右端的连续性,假设分帧后的信号为S(n),n=0,1…,N-1,N为帧的大小,那么乘上汉明窗后

S′(n)=S(n)×W(n)

其中,W(n)表示汉明窗,不同的a值会产生不同的汉明窗,一般情况下a取0.46。

7.根据权利要求3所述的基于MFCC和向量元学习的声纹识别方法,其特征在于,所述三角带通滤波器组包括40个三角带通滤波器,所述离散余弦变换子步骤将计算得到的40个对数能量代入离散余弦变换,得到13阶MFCC。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学,未经桂林电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011220705.6/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top