[发明专利]基于信噪比加权模板特征匹配的抗噪语音识别方法及装置有效
申请号: | 201410040474.9 | 申请日: | 2014-01-27 |
公开(公告)号: | CN103778914B | 公开(公告)日: | 2017-02-15 |
发明(设计)人: | 宁更新;吴丽菲;宁小娟 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L19/03;G10L19/04 |
代理公司: | 广州市华学知识产权代理有限公司44245 | 代理人: | 蔡茂略 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于信噪比加权模板特征匹配的抗噪语音识别方法,包括以下步骤步骤一对输入语音信号进行预处理,求得相位系数;步骤二计算输入语音的特征,即相位MFCC;步骤三对基于SNR的模板进行特征匹配。本发明还公开了一种实现基于信噪比加权模板特征匹配的抗噪语音识别方法的装置,包括电源模块、显示模块、存储模块、DSP/ARM数字处理模块、麦克风、A/D转换器和USB接口。具有适应范围广、准确性高、成本低、使用便捷和适应性强等优点。 | ||
搜索关键词: | 基于 加权 模板 特征 匹配 语音 识别 方法 装置 | ||
【主权项】:
一种基于信噪比加权模板特征匹配的抗噪语音识别方法,其特征在于,包括以下步骤:步骤一:对输入语音信号进行预处理,求得相位系数;步骤二:计算输入语音的特征,即相位MFCC;步骤三:对基于SNR的模板进行特征匹配;其特征在于,所述步骤一包括以下步骤:步骤A、将数字化后的语音信号s[n]进行分帧处理,同时采用汉明窗进行加窗,并分为T帧:{s0[n],s1[n],...,st[n],...,sT‑1[n]},其中:st[n]={s[Kt],s[Kt+1],...,s[Kt+N‑1]},K为帧移,N为帧长,st[n]为在时刻t的帧信号序列;步骤B、将所得帧信号进行周期延拓,得到自相关函数:R[k]=Σn=0N-1s~t[n]s~t[n+k],k=0,1,...,N-1;]]>由自相关函数的表达式可得出,R[k]是两个N维向量的点积,x0={s~t[0],s~t[1],...,s~t[N-1]},]]>xk={s~t[k],...,s~t[N-1],s~t[0],...,s~t[k-1]},]]>R[k]=x0Txk=||x||2cos(θk),]]>其中,||x||2=||x0||2=||xk||2,表示的是帧能量,θk是向量x0和向量xk在N维空间的夹角;步骤C、将归一化的自相关系数进行反余弦的非线性变化,得到相位系数:P[k]=θk=cos-1(R[k]||x||2),]]>P[k]的取值范围是0到π之间,将其归一化到0到1间,得到归一化的相位自相关函数:Pn[k]=P[k]π=cos-1(Rn[k])π=cos-1(R[k]||x||2)π,]]>其中,Pn[k]用于提高在低信噪比情况下的鲁棒性。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410040474.9/,转载请声明来源钻瓜专利网。
- 上一篇:一种治疗肾病的药物的制备方法
- 下一篇:一种海洋泵浦的腐蚀防护层及其喷涂方法