[发明专利]一种用于声纹识别的低功耗模拟域特征向量提取方法有效
| 申请号: | 202010577295.4 | 申请日: | 2020-06-22 |
| 公开(公告)号: | CN111667838B | 公开(公告)日: | 2022-10-14 |
| 发明(设计)人: | 浦宁;姜汉钧;张春;王志华 | 申请(专利权)人: | 清华大学 |
| 主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L17/18;G10L17/20 |
| 代理公司: | 西安智大知识产权代理事务所 61215 | 代理人: | 段俊涛 |
| 地址: | 100084 北京市海淀区1*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 用于 声纹 识别 功耗 模拟 特征向量 提取 方法 | ||
1.一种用于声纹识别的低功耗模拟域特征向量提取方法,输入为麦克风输出的语音信号,从时域和模拟域提取特征,通过构造一组带通滤波器逼近MFCC特征提取中的Mel三角滤波器组,使得构造的带通滤波器组的中心频率与Mel三角滤波器组相同,满足非线性对数频率特性,再将模拟滤波输出的时域信号通过ADC后取模平方得到对应特征值,其特征在于,包括对应于全模拟滤波特征提取的高性能模式和对应于混合特征提取的超低功耗模式两种模式,其中:
所述高性能模式使用16个带通滤波器进行全模拟滤波特征提取,首先将麦克风输出的语音信号通过低噪声前置放大器调理放大,然后分别输入16个通道进行带通滤波,每个带通滤波器的中心频率模拟MFCC特征提取中Mel三角滤波器的中心频率设计;然后将提取到的模拟滤波特征通过12位逐次逼近型ADC转换到数字域,在数字域完成求取模平方的操作得到对应特征向量;
所述超低功耗模式通过压缩相似的冗余特征以进一步降低特征维度,采用5个带通滤波器,1个比较器和数字逻辑电路实现混合特征提取,通过比较器和计数器提取语音信号的过零率,即统计信号幅值为0的次数,过零率反映了语音信号的变化快慢,是一种从时域进行提取而反映频域信息的特征,输入信号经比较器与0电平比较后输出一系列含高低电平的脉冲,其中高电平的上升沿和下降沿对应语音信号的负过零和正过零,对高电平脉冲计数,再乘以2得到语音信号的过零率,该模式提取的混合特征的维度是8维,包括5维模拟滤波特征及其均值和方差,再加上1维过零率特征。
2.根据权利要求1所述用于声纹识别的低功耗模拟域特征向量提取方法,其特征在于,所述每个带通滤波器的中心频率模拟MFCC特征提取中Mel三角滤波器的中心频率设计,具体实现方式是将语音信号的常用采样频率按照该公式Mel(f)=2595*log10(1+f/700)转换到梅尔频率域,然后在梅尔频率域按照滤波器个数进行等间隔划分,再将划分的结果按上式转换为对应的自然频率作为带通滤波器的中心频率,其中Mel(f)是梅尔频率,f是自然频率。
3.根据权利要求1所述用于声纹识别的低功耗模拟域特征向量提取方法,其特征在于,所述带通滤波器为非理想物理可实现的带通滤波器,其阶数为2阶。
4.根据权利要求1或3所述用于声纹识别的低功耗模拟域特征向量提取方法,其特征在于,所述带通滤波器采用Gm-C结构,通过调整跨导器偏置电流的大小从而改变跨导器的Gm值,来达到改变滤波器中心频率的目的。
5.根据权利要求4所述用于声纹识别的低功耗模拟域特征向量提取方法,其特征在于,通过调整所述带通滤波器的个数以得到不同维度的特征,从而满足不同应用场景下识别精度和功耗的折中。
6.根据权利要求1所述用于声纹识别的低功耗模拟域特征向量提取方法,其特征在于,所述方法还用于关键词检测。
7.根据权利要求1所述用于声纹识别的低功耗模拟域特征向量提取方法,其特征在于,所提取特征向量输入数字域神经网络进行识别。
8.根据权利要求7所述用于声纹识别的低功耗模拟域特征向量提取方法,其特征在于,所述神经网络为CNN、LSTM或GRU。
9.根据权利要求1所述用于声纹识别的低功耗模拟域特征向量提取方法,其特征在于,所述麦克风输出的语音信号先进行分帧和加窗的预处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010577295.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种水稻愈伤组织的超低温保存方法
- 下一篇:一种自动调节座椅





