[发明专利]语音命令识别方法和系统有效
申请号: | 201310035979.1 | 申请日: | 2013-01-30 |
公开(公告)号: | CN103971685A | 公开(公告)日: | 2014-08-06 |
发明(设计)人: | 岳帅;卢鲤;张翔;谢达东;刘海波;陈波;刘荐 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L15/28 | 分类号: | G10L15/28;G10L15/06 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 张晓峰;宋志强 |
地址: | 518044 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 命令 识别 方法 系统 | ||
1.一种语音命令识别方法,其特征在于,包括:
对语音进行低于指定精度的声学模型训练计算,得到背景声学模型;
对语音进行高于指定精度的声学模型训练计算,得到前景声学模型;
依据所述前景声学模型和背景声学模型构建解码网络,其中包括:从所述前景声学模型中选择命令词包含的音素,利用选出的音素构建所述命令词对应的解码路径,依据所述背景声学模型的音素构建对应的解码路径;
依据所述解码网络对输入的语音进行解码,在语音结束后判断解码结果是否为指定命令词的字符串,在解码结果为指定命令词的字符串时触发该命令词对应的操作。
2.根据权利要求1所述的方法,其特征在于,
所述对语音进行低于指定精度的声学模型训练计算的过程中,具体包括:用于描述音素的混合高斯模型中的高斯数量B1低于指定值;
所述对语音进行高于指定精度的声学模型训练计算的过程中,具体包括:用于描述音素的混合高斯模型中的高斯数量B2高于指定值,且所述B2大于B1。
3.根据权利要求2所述的方法,其特征在于,所述对语音进行低于指定精度的声学模型训练计算的过程中用于描述音素的混合高斯模型中的高斯数量B1为4或8;所述对语音进行高于指定精度的声学模型训练计算的过程中用于描述音素的混合高斯模型中的高斯数量B2为16或32或32以上的值。
4.根据权利要求1至3任一项所述的方法,其特征在于,所述对语音进行低于指定精度的声学模型训练计算,得到背景声学模型,具体为:
对语音进行单音素的声学模型训练计算,将得到的单音素声学模型作为背景声学模型;
或者,对语音进行三音素的声学模型训练计算,得到三音素声学模型,对该三音素声学模型中的三音素进行聚类,将聚类后的三音素声学模型作为背景声学模型。
5.根据权利要求1至3任一项所述的方法,其特征在于,所述对语音进行高于指定精度的声学模型训练计算,得到前景声学模型,具体为:
对语音进行三音素的声学模型训练,利用命令词对应的语音对得到的三音素声学模型进行自适应计算,将经过自适应计算后的三音素声学模型作为前景声学模型;
对语音进行单音素的声学模型训练计算,其中用于描述单音素的混合高斯模型中的高斯数量高于指定高值,利用命令词对应的语音对得到的单音素声学模型进行自适应计算,将经过自适应计算后的单音素声学模型作为背景声学模型。
6.根据权利要求1所述的方法,其特征在于,所述依据所述前景声学模型和背景声学模型构建解码网络,具体包括:
从所述前景声学模型中选择各个命令词包含的音素;针对每一命令词,利用选出的该命令词包含的音素构建该命令词对应的一条解码路径;
依据所述背景声学模型的所有音素构建对应的解码路径。
7.根据权利要求1所述的方法,其特征在于,
所述依据所述解码网络对输入的语音进行解码,在语音结束后判断解码结果是否为指定命令词的字符串,在解码结果为指定命令词的字符串时触发该命令词对应的操作,具体包括:
检测语音活动,在检测到有语音开始后,再依据所述解码网络对输入的语音进行解码,并继续检测语音是否结束,如果未结束则继续依据所述解码网络对输入的语音进行解码,如果结束则判断当前解码结果是否为指定命令词的字符串,在解码结果为指定命令词的字符串时触发该命令词对应的操作。
8.一种语音命令识别系统,其特征在于,包括:
背景声学模型训练模块,用于对语音进行低于指定精度的声学模型训练计算,得到背景声学模型;
前景声学模型训练模块,用于对语音进行高于指定精度的声学模型训练计算,得到前景声学模型;
解码网络构建模块,用于依据所述前景声学模型和背景声学模型构建解码网络,其中包括:从所述前景声学模型中选择命令词包含的音素,利用选出的音素构建所述命令词对应的解码路径,依据所述背景声学模型的音素构建对应的解码路径;
解码器,用于依据所述解码网络对输入的语音进行解码;
判断模块,用于在语音结束后判断解码器的解码结果是否为指定命令词的字符串,在解码结果为指定命令词的字符串时触发该命令词对应的操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310035979.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种采用银参比电极的小型块状氧电极
- 下一篇:一种智能酒精测试仪