[发明专利]一种简单有效的短语语音识别方法有效
| 申请号: | 201410462400.4 | 申请日: | 2014-09-12 |
| 公开(公告)号: | CN104240699B | 公开(公告)日: | 2017-05-10 |
| 发明(设计)人: | 杨莹春;吴朝晖;邓立才 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L15/10 |
| 代理公司: | 杭州天勤知识产权代理有限公司33224 | 代理人: | 胡红娟 |
| 地址: | 310027 浙*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 简单 有效 短语 语音 识别 方法 | ||
1.一种简单有效的短语语音识别方法,包括如下步骤:
(1)搜集一定数量的待识别短语发音的语音特征训练生成一个语音背景模型SBM;
(2)计算每一目标短语的训练语音特征在语音背景模型SBM上的GMMToken配比向量GTR;
(3)接收测试语音,计算测试语音特征在语音背景模型SBM上的GMMToken配比向量GTR;
(4)计算测试语音特征与每一目标短语的训练语音特征关于GMM Token配比向量GTR之间的相似度,根据相似度生成对应的目标短语得分;
(5)对最高目标短语得分进行阈值过滤后,识别确定最高目标短语得分所对应的目标短语即为测试语音的真实内容;
所述的步骤(2)和(3)中,计算特定语音特征在语音背景模型SBM上的GMM Token配比向量GTR的具体过程如下;特定语音为训练语音或测试语音,特定语音特征以X={x1,x2,...,xn}表示,xi为特定语音的第i帧特征向量;
首先,将特定语音特征转换成一个GMM Token序列T如下:
T={t1,t2,...,tn} ti∈{1,2,...,M}
其中:ti为GMM Token序列T中第i个Token元素,其取值为语音背景模型SBM中的一高斯分量标号,M为语音背景模型SBM的混合阶数,i为自然数且1≤i≤n,n为特定语音的总特征帧数;所述的Token元素ti表示为最有可能生成对应帧特征向量xi的高斯分量标号,其表达式如下:
其中:ωm为语音背景模型SBM中第m个高斯分量对应的权重,pm(xi)为特征向量xi在语音背景模型SBM中第m个高斯分量上的似然得分,即特征向量xi由语音背景模型SBM中第m个高斯分量生成的概率;
然后,根据以下公式统计语音背景模型SBM中每一个高斯分量标号在GMM Token序列T中出现的频率,即GMM Token配比分量fm;
其中:Nm为高斯分量标号m在GMM Token序列T中出现的次数,fm为高斯分量标号m在GMM Token序列T中出现的频率,m为自然数且1≤m≤M;
最后,根据GMM Token配比分量fm,构建特定语音特征在语音背景模型SBM上的GMM Token配比向量GTR如下:
GTR=[f1,f2,...,fM]T
对于N个目标短语的训练语音特征,则依据上述流程计算出对应的GMM Token配比向量GTRt1,GTRt2,…,GTRtN,N为大于1的自然数;对于任一测试语音特征Xe,则依据上述流程计算出对应的GMM Token配比向量GTRe。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410462400.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种蝴蝶兰组培苗的栽培新方法
- 下一篇:一种调整电子设备的方法及电子设备





