[发明专利]一种全音素框架下的通用语音唤醒识别方法及系统在审

申请号：	201710002097.3	申请日：	2017-01-03
公开（公告）号：	CN108281137A	公开（公告）日：	2018-07-13
发明（设计）人：	徐及;张震;李文凤;李鹏;颜永红	申请（专利权）人：	中国科学院声学研究所;国家计算机网络与信息安全管理中心
主分类号：	G10L15/02	分类号：	G10L15/02;G10L15/06;G10L15/08;G10L15/183;G10L17/02;G10L17/04;G10L19/16;G10L25/30
代理公司：	北京方安思达知识产权代理有限公司 11472	代理人：	王宇杨;杨青
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种全音素框架下的通用语音唤醒识别方法及系统，所述方法包括：首先训练深度神经网络声学模型，根据唤醒词修改词典，构造基于filler的解码网络，并根据训练样本训练支持向量机分类器；对输入语音进行预处理，将处理后的语音特征输入解码网络进行解码，根据深度神经网络声学模型计算声学得分，得到解码结果；将识别成功的解码结果的统计量输入支持向量机分类器进行分类，得到最终的识别结果。本发明的方法对全部无调音素扩展得到的三音子状态进行建模得到的是通用声学模型，解码过程中限制解码路径，可以提高唤醒性能，同时结合后期处理部分通过对每条路径上音素后验概率等多维统计量进行分析，消除虚警率升高的隐患。
搜索关键词：	音素唤醒解码结果神经网络声学模型通用语音支持向量机分类器预处理通用声学模型向量机分类器解码多维统计后期处理后验概率解码过程解码路径解码网络输入解码输入语音输入支持训练样本语音特征三音子统计量虚警率声学建模升高分类分析网络成功
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种全音素框架下的通用语音唤醒识别方法，所述方法包括：首先训练深度神经网络声学模型，根据唤醒词修改词典，构造基于filler的解码网络，并根据训练样本训练支持向量机分类器；对输入语音进行预处理，将处理后的语音特征输入解码网络进行解码，根据深度神经网络声学模型计算声学得分，得到解码结果；将识别成功的解码结果的统计量输入支持向量机分类器进行分类，得到最终的识别结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院声学研究所;国家计算机网络与信息安全管理中心，未经中国科学院声学研究所;国家计算机网络与信息安全管理中心许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710002097.3/，转载请声明来源钻瓜专利网。

上一篇：赝表面声波聚焦器
下一篇：年龄判别模型训练及智能语音交互方法、设备及存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L15-00 语音识别
G10L15-02 .语音识别的特征提取；识别单位的选择
G10L15-04 .分段或字极限检测
G10L15-06 .创建基准模板；训练语音识别系统，例如对说话者声音特征的适应
G10L15-08 .语音分类或检索
G10L15-20 .专门适用于不利环境

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种全音素框架下的通用语音唤醒识别方法及系统在审

专利文献下载