[发明专利]一种低资源嵌入式语音识别的拒识方法有效
申请号: | 201410387404.0 | 申请日: | 2014-08-05 |
公开(公告)号: | CN105321518B | 公开(公告)日: | 2018-12-04 |
发明(设计)人: | 张鹏远;潘接林;颜永红 | 申请(专利权)人: | 中国科学院声学研究所;北京中科信利技术有限公司 |
主分类号: | G10L15/26 | 分类号: | G10L15/26 |
代理公司: | 北京方安思达知识产权代理有限公司 11472 | 代理人: | 王宇杨;王敬波 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种低资源嵌入式语音识别的拒识方法,该方法包括:基于命令词表和垃圾音素列表,分别构建命令词解码网络和垃圾音素解码网络,将垃圾音素解码网络并联到命令词解码网络中,形成完整的解码网路空间;生成语音背景概率得分表。将待识别语音输入解码网络空间进行第一次识别:解码识别,对第一次识别结果中的垃圾因素拒识,再对第一次识别结果中的命令词进行第二次判别:置信度判别,得到最终识别结果。本方法可提高对集外词的拒识率,节省内存占用,满足了低资源条件嵌入式语音识别的应用需求。 | ||
搜索关键词: | 一种 资源 嵌入式 语音 识别 方法 | ||
【主权项】:
1.一种低资源嵌入式语音识别的拒识方法,包括:基于命令词表,构建命令词的解码网络;基于垃圾音素列表,构建垃圾音素解码网络;将垃圾音素解码网络并联到命令词解码网络中,形成完整的解码网路空间;生成语音背景概率得分表;采用二次判别拒识方法对待识别语音进行识别,其中所述的二次判别拒识方法为:对待识别语音进行第一次识别,对第一次识别结果中的垃圾音素拒识,再对第一次识别结果中的命令词进行第二次判别,得到最终识别结果;所述第一次识别包括:101)对待识别语音进行预处理,得到若干个语音特征帧;102)将一个语音特征帧输入解码网络空间,在语音背景概率得分表中查询该语音特征帧的背景概率得分,并进行记录;103)如果当前语音特征帧为第一个语音特征帧,转入104);否则,转入105);104)计算所有与根节点相连节点的似然概率得分,转入102);105)获取当前语音特征帧之前的所有语音特征帧在解码网络中的活跃节点;106)判断当前语音特征帧是否到达词尾节点,如果判断结果是肯定的,转入108);否则,转入107);107)计算当前语音特征帧中所有节点的似然概率得分,转入114);108)创建新令牌,将词尾节点持有的有效令牌连接到新令牌上;109)判断新令牌持有路径中的最高似然概率得分是否大于门限;如果判断结果是肯定的,转入111);否则,转入110);110)删除新令牌,转入114);111)判断新令牌对应的单词是否为垃圾音素,如果判断结果是肯定的,转入112);否则,转入114);112)获取重入次数,所述重入次数等于新令牌持有路径的长度;判断重入次数是否超过门限;如果判断结果是肯定的,转入114);否则,转入113);113)构建重入令牌;用重入令牌替换重入节点上似然概率得分最低的令牌;转入114);114)判断当前语音特征帧是否为最后一帧;如果判断结果是肯定的,转入115);否则,转入102);115)第一次识别结束,根据解码路径判断识别结果是否为命令词,如果判断结果是肯定的,输出命令词;否则,输出拒识信息;所述的第二次判别包括:201)计算命令词中每一个语音特征帧的后验概率得分,所述每一个语音特征帧的后验概率得分等于该语音特征帧的似然概率得分除以该语音特征帧的背景概率得分;202)计算命令词中每一个音素的置信度得分,所述每一个音素的置信度得分等于该音素包含的所有语音特征帧的后验概率得分的平均值;203)计算命令词的置信度得分,所述命令词的置信度得分等于该命令词包含的所有音素的置信度得分的平均值;204)将命令词置信度得分与预先设定的门限进行比较,如果得分大于该门限,则接受该命令词,否则就拒识。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;北京中科信利技术有限公司,未经中国科学院声学研究所;北京中科信利技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410387404.0/,转载请声明来源钻瓜专利网。
- 上一篇:音频处理方法和电子设备
- 下一篇:电子键盘乐器