[发明专利]一种基于级联DNN的语音唤醒优化方法在审

申请号：	201910334772.1	申请日：	2019-04-24
公开（公告）号：	CN109887511A	公开（公告）日：	2019-06-14
发明（设计）人：	赵升	申请（专利权）人：	武汉水象电子科技有限公司
主分类号：	G10L17/04	分类号：	G10L17/04;G10L17/24;G10L17/18
代理公司：	连云港联创专利代理事务所(特殊普通合伙) 32330	代理人：	刘刚
地址：	430000 湖北省武汉市东湖新技术开发区关南***	国省代码：	湖北;42
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于级联DNN的语音唤醒优化方法，包括1)、实时获取麦克风采集的语音信号，经过特征抽取，获得实时语音信号的逐帧声学特征；2)、以固定窗长，截取声学特征序列，形成一帧，作为第一级DNN的输入；3)、经过第一级DNN声学模型的前向过程计算，输出得到逐帧音素的声学后验概率；4)、以固定的窗长截取第一级DNN的输出，形成一帧音素后验概率序列，作为第二级DNN的输入；5)、经过第二级DNN前向过程计算，判定并输出是否唤醒。本发明能最大程度利用DNN的抗噪能力，环境适应性强，不必先做VAD再做唤醒检测；也不必对语音背景单独建模；两级模型能够互补，极大减少训练所需语料；没有语言模型，不需要文本语料。
搜索关键词：	第一级过程计算后验概率声学特征唤醒语音截取级联前向输出音素语料逐帧实时语音信号环境适应性麦克风唤醒检测抗噪能力声学模型实时获取特征抽取语言模型语音信号固定窗固定的声学窗长建模两级优化判定文本采集
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于级联DNN的语音唤醒优化方法，其特征在于，包括以下步骤：1)实时获取麦克风采集的语音信号，经过特征抽取，获得实时语音信号的逐帧声学特征；2)以固定窗长，截取声学特征序列，形成一帧，作为第一级DNN的输入；3)经过第一级DNN声学模型的前向过程计算，输出得到逐帧音素的声学后验概率；4)以固定的窗长截取第一级DNN的输出，形成一帧音素后验概率序列，作为第二级DNN的输入；5)经过第二级DNN前向过程计算，判定是否唤醒，并输出唤醒与否的判定结果。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于武汉水象电子科技有限公司，未经武汉水象电子科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201910334772.1/，转载请声明来源钻瓜专利网。

上一篇：一种基于经验模态分解与MFCC的声纹识别方法及装置
下一篇：智慧酒店客房控制方法及系统

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L17-00 讲话者辨认或验证

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于级联DNN的语音唤醒优化方法在审

专利文献下载