[发明专利]一种基于级联DNN的语音唤醒优化方法在审

专利信息
申请号: 201910334772.1 申请日: 2019-04-24
公开(公告)号: CN109887511A 公开(公告)日: 2019-06-14
发明(设计)人: 赵升 申请(专利权)人: 武汉水象电子科技有限公司
主分类号: G10L17/04 分类号: G10L17/04;G10L17/24;G10L17/18
代理公司: 连云港联创专利代理事务所(特殊普通合伙) 32330 代理人: 刘刚
地址: 430000 湖北省武汉市东湖新技术开发区关南*** 国省代码: 湖北;42
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于级联DNN的语音唤醒优化方法,包括1)、实时获取麦克风采集的语音信号,经过特征抽取,获得实时语音信号的逐帧声学特征;2)、以固定窗长,截取声学特征序列,形成一帧,作为第一级DNN的输入;3)、经过第一级DNN声学模型的前向过程计算,输出得到逐帧音素的声学后验概率;4)、以固定的窗长截取第一级DNN的输出,形成一帧音素后验概率序列,作为第二级DNN的输入;5)、经过第二级DNN前向过程计算,判定并输出是否唤醒。本发明能最大程度利用DNN的抗噪能力,环境适应性强,不必先做VAD再做唤醒检测;也不必对语音背景单独建模;两级模型能够互补,极大减少训练所需语料;没有语言模型,不需要文本语料。
搜索关键词: 第一级 过程计算 后验概率 声学特征 唤醒 语音 截取 级联 前向 输出 音素 语料 逐帧 实时语音信号 环境适应性 麦克风 唤醒检测 抗噪能力 声学模型 实时获取 特征抽取 语言模型 语音信号 固定窗 固定的 声学 窗长 建模 两级 优化 判定 文本 采集
【主权项】:
1.一种基于级联DNN的语音唤醒优化方法,其特征在于,包括以下步骤:1)实时获取麦克风采集的语音信号,经过特征抽取,获得实时语音信号的逐帧声学特征;2)以固定窗长,截取声学特征序列,形成一帧,作为第一级DNN的输入;3)经过第一级DNN声学模型的前向过程计算,输出得到逐帧音素的声学后验概率;4)以固定的窗长截取第一级DNN的输出,形成一帧音素后验概率序列,作为第二级DNN的输入;5)经过第二级DNN前向过程计算,判定是否唤醒,并输出唤醒与否的判定结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于武汉水象电子科技有限公司,未经武汉水象电子科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201910334772.1/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top