[发明专利]一种基于功率谱Gabor特征序列递归模型的语音识别方法有效
申请号: | 201710292486.4 | 申请日: | 2017-04-28 |
公开(公告)号: | CN107103913B | 公开(公告)日: | 2020-02-04 |
发明(设计)人: | 卜起荣;张晓;冯筠;曹正文 | 申请(专利权)人: | 西北大学 |
主分类号: | G10L25/21 | 分类号: | G10L25/21;G10L21/0208;G10L15/10 |
代理公司: | 61216 西安恒泰知识产权代理事务所 | 代理人: | 李婷;张明 |
地址: | 710069 *** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 功率 gabor 特征 序列 递归 模型 语音 识别 方法 | ||
1.一种基于功率谱Gabor特征序列递归模型的语音识别方法,其特征在于,包括以下步骤:
步骤一,语音信号的预处理
对获取的语音信号进行端点检测,分离并去除语音信号中的噪声信息,获得语音信号中的有效部分,并求其功率谱;
步骤二,提取功率谱Gabor特征序列
步骤2.1,根据所述的功率谱,提取所述的有效部分的功率归一化频谱特征;
步骤2.2,将所述的功率归一化频谱特征按照帧索引顺序组成一个序列C,然后分别进行一阶差分和二阶差分处理后,分别得到Delta频谱特征和DoubleDelta频谱特征;
步骤2.3,将所述的功率归一化频谱特征、Delta频谱特征以及DoubleDelta频谱特征组成功率归一化频谱特征集,然后通过时空Gabor滤波,将时间调制滤波器表示为行向量,与功率归一化频谱特征集的每个通道独立地卷积;同样,频域调制滤波器表示为列向量,与功率归一化频谱特征集的每个帧独立地卷积;
步骤2.3中,所述的卷积采用的公式为:
上式中,k和n分别是功率归一化频谱特征的频谱和时间索引,i和j分别表示频谱和时间相对中心的偏移,PNSpec(k,n)表示输入的语音信号特征集,filterfunction(i,j)表示时空Gabor滤波函数;
步骤2.4,针对所述的功率归一化频谱特征集,执行直方图均衡化,然后通过PCA将高维特征投影到低维空间上,得功率谱Gabor特征集,并将功率谱Gabor特征集组成语音特征序列X;
步骤三,构建语音特征序列的递归图
将语音特征序列X按照如下公式计算其递归图r:
r=θ(ε-||x(ik)-x(im)||),ik,im=1...n
上式中,n是语音特征序列经历的状态数,k、m表示帧索引,x(ik)和x(im)是在ik和im序列位置处观察到的语音特征序列上的值,||.||表示Euclidean范数,ε表示临界距离,ε<1;而θ表示Heaviside函数,其定义如下所示:
步骤四,语音信号相似性检测
计算所述的递归图r与模板库中每一类信号的递归图ri之间的距离,则最小的一个距离值对应的模板库中的语音信号即为识别出的结果;
所述的模板库是指,在进行语音识别之前,先采集各类标准的语音信号,按照步骤一至三的方法进行处理,得到标准的语音信号的递归图ri,将这些语音信号的递归图存储在模板库中;
步骤四中计算距离采用的公式为:
上式中,ri是模板库中每一类信号的语音特征序列的递归图,rj是待测语音特征序列的递归图,C(ri|rj)是按照MPEG-1压缩算法先训练压缩图像rj再压缩图像ri之后值的大小,从而求得ri图像中去除和rj图像共有的冗余信息后两者之间的最小近似值。
2.如权利要求1所述的基于功率谱Gabor特征序列递归模型的语音识别方法,其特征在于,步骤一的具体过程包括:
步骤1.1,对获取的语音信号,利用短时能量或者过零率指标进行端点检测,将语音信号中的有效部分和噪声信息分离开来;
步骤1.2,通过高通滤波器完成所述有效部分的预加重过程;
步骤1.3,经过预加重的有效部分再进行加窗分帧操作;
步骤1.4,进行快速傅里叶变换,以得到在频谱上的能量分布;对频谱取模平方得到功率谱。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西北大学,未经西北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710292486.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:儿童自行车
- 下一篇:鞋垫(塑料足弓支撑扁平足矫正)