[发明专利]一种智能硬件的语音唤醒方法和装置有效
| 申请号: | 201510982997.X | 申请日: | 2015-12-23 |
| 公开(公告)号: | CN105632486B | 公开(公告)日: | 2019-12-17 |
| 发明(设计)人: | 杨占磊;司玉景 | 申请(专利权)人: | 北京奇虎科技有限公司;奇智软件(北京)有限公司 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L17/22 |
| 代理公司: | 11323 北京市隆安律师事务所 | 代理人: | 权鲜枝 |
| 地址: | 100088 北京市西城区新*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 智能 硬件 语音 唤醒 方法 装置 | ||
1.一种智能硬件的语音唤醒方法,包括:
在智能硬件中检测到音频数据时,从所述音频数据中提取一段或多段语音数据;
将所述一段或多段语音数据与基于唤醒词训练的语音模型进行匹配;所述语音模型为深度神经网络模型,基于表征唤醒词和填充词的目标语音数据的滤波器组特征训练生成;
当匹配成功时,唤醒所述智能硬件。
2.如权利要求1所述的方法,其特征在于,所述从所述音频数据中提取一段或多段语音数据的步骤包括:
对所述语音数据进行尾点检测,识别出一段或多段非静音区;
提取所述一段或多段非静音区,作为一段或多段语音数据。
3.如权利要求2所述的方法,其特征在于,所述对所述语音数据进行尾点检测,识别出一段或多段非静音区的步骤包括:
计算每一帧音频数据属于语音数据的概率;
当所述概率高于预设的概率阈值时,确定所述音频数据属于语音帧;
当连续的语音帧超过预设的数量阈值时,确定所述连续的语音帧为一段非静音区。
4.如权利要求1所述的方法,其特征在于,所述将所述一段或多段语音数据与基于唤醒词训练的语音模型进行匹配的步骤包括:
提取每一段语音数据的滤波器组特征;
将所述滤波器组特征输入所述深度神经网络模型,以确定所述语音数据表征唤醒词或填充词;
判断表征所述唤醒词的语音数据是否与所述唤醒词排序一致;若是,则确定所述一段或多段语音数据与基于唤醒词训练的语音模型匹配。
5.如权利要求4所述的方法,其特征在于,所述将所述滤波器组特征输入所述深度神经网络模型,以确定所述语音数据表征唤醒词或填充词的步骤包括:
计算所述滤波器组特征属于所述语音数据表征唤醒词或填充词的后验概率;
采用所述后验概率计算置信度;
当所述置信度高于预设的置信度阈值时,确定所述语音数据表征唤醒词或填充词。
6.如权利要求5所述的方法,其特征在于,所述将所述滤波器组特征输入所述深度神经网络模型,以确定所述语音数据表征唤醒词或填充词的步骤还包括:
结合位于当前语音数据之前的语音数据的后验概率及位于当前语音数据之后的语音数据的后验概率,当前语音数据的后验概率进行平滑处理。
7.一种智能硬件的语音唤醒装置,包括:
语音数据提取模块,适于在智能硬件中检测到音频数据时,从所述音频数据中提取一段或多段语音数据;
语音数据匹配模块,适于将所述一段或多段语音数据与基于唤醒词训练的语音模型进行匹配;所述语音模型为深度神经网络模型,基于表征唤醒词和填充词的目标语音数据的滤波器组特征训练生成;
智能硬件唤醒模块,适于在匹配成功时,唤醒所述智能硬件。
8.如权利要求7所述的装置,其特征在于,所述语音数据提取模块还适于:
对所述语音数据进行尾点检测,识别出一段或多段非静音区;
提取所述一段或多段非静音区,作为一段或多段语音数据。
9.如权利要求7所述的装置,其特征在于,所述语音数据提取模块还适于:
计算每一帧音频数据属于语音数据的概率;
当所述概率高于预设的概率阈值时,确定所述音频数据属于语音帧;
当连续的语音帧超过预设的数量阈值时,确定所述连续的语音帧为一段非静音区。
10.如权利要求7所述的装置,其特征在于,所述语音数据匹配模块还适于:
提取每一段语音数据的滤波器组特征;
将所述滤波器组特征输入所述深度神经网络模型,以确定所述语音数据表征唤醒词或填充词;
判断表征所述唤醒词的语音数据是否与所述唤醒词排序一致;若是,则确定所述一段或多段语音数据与基于唤醒词训练的语音模型匹配。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京奇虎科技有限公司;奇智软件(北京)有限公司,未经北京奇虎科技有限公司;奇智软件(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510982997.X/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种语音识别方法和装置
- 下一篇:音乐处理系统及方法





