[发明专利]一种远场语音唤醒方法及设备有效
申请号: | 201710853952.1 | 申请日: | 2017-09-20 |
公开(公告)号: | CN107464565B | 公开(公告)日: | 2020-08-04 |
发明(设计)人: | 耿雷 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;G10L15/06;G10L15/26;G10L21/0208 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 唤醒 方法 设备 | ||
本发明实施例公开了一种远场语音唤醒方法及设备。其中,远场语音唤醒方法包括:前端音频信号处理芯片获取麦克风阵列拾取的多路语音信号中的至少一路语音信号,并确定至少一路语音信号是否为语音唤醒信号;主处理器获取多路语音信号中的至少两路语音信号,并依据多路语音唤醒识别模型确定至少两路语音信号是否为语音唤醒信号,若至少一路语音信号是语音唤醒信号,且至少两路语音信号是语音唤醒信号,则主处理器控制执行唤醒操作。本发明实施例基于前端音频信号处理芯片和主处理器,对麦克风阵列拾取的多路语音信号作两次语音唤醒信号识别,大大降低了误唤醒率,提升了用户体验。
技术领域
本发明实施例涉及语音唤醒技术,尤其涉及一种远场语音唤醒方法及设备。
背景技术
随着语音识别技术的飞速发展,语音唤醒技术的应用越来越普遍,随着用户对语音唤醒设备的体验要求越来越高,语音唤醒技术不再局限于近距离范围的唤醒,因此出现了远场语音唤醒技术。
现有的远场语音唤醒技术有两种实现方式,一种是基于前端音频信号处理芯片(通常是音频专用DSP)的语音唤醒实现方式,另一种是基于主处理器(CPU)的语音唤醒实现方式。但是,无论是基于前端音频信号处理芯片还是基于主处理器的离线唤醒识别引擎,都受限于芯片的运算能力及存储容量,导致离线识别的声学模型相对简单,从而使语音唤醒引擎性能下降,造成语音唤醒误识别的增加,尤其是在有噪声环境下,误唤醒的几率会更高。
发明内容
本发明实施例提供一种远场语音唤醒方法及设备,大大降低了误唤醒率,提升了用户体验。
第一方面,本发明实施例提供了一种远场语音唤醒方法,该方法包括:
前端音频信号处理芯片获取麦克风阵列拾取的多路语音信号中的至少一路语音信号,并确定所述至少一路语音信号是否为语音唤醒信号;
主处理器获取所述多路语音信号中的至少两路语音信号,所述主处理器依据多路语音唤醒识别模型确定所述至少两路语音信号是否为语音唤醒信号,其中,所述多路语音唤醒识别模型预先依据多路语音唤醒样本信号训练得到;
若所述至少一路语音信号是语音唤醒信号,且所述至少两路语音信号是语音唤醒信号,则所述主处理器控制执行唤醒操作。
第二方面,本发明实施例还提供了一种远场语音唤醒设备,该设备包括麦克风阵列、前端音频信号处理芯片和主处理器;其中,
所述麦克风阵列拾取多路语音信号;
所述前端音频信号处理芯片获取所述多路语音信号中的至少一路语音信号,并确定所述至少一路语音信号是否为语音唤醒信号;
所述主处理器获取所述多路语音信号中的至少两路语音信号,并依据多路语音唤醒识别模型确定所述至少两路语音信号是否为语音唤醒信号,其中,所述多路语音唤醒识别模型预先依据多路语音唤醒样本信号训练得到;
若所述至少一路语音信号是语音唤醒信号,且所述至少两路语音信号是语音唤醒信号,则所述主处理器控制执行唤醒操作。
本发明实施例通过前端音频信号处理芯片获取麦克风阵列拾取的多路语音信号中的至少一路语音信号,并确定至少一路语音信号是否为语音唤醒信号;通过主处理器获取多路语音信号中的至少两路语音信号,并利用多路语音唤醒识别模型确定至少两路语音信号是否为语音唤醒信号,基于前端音频信号处理芯片和主处理器,对麦克风阵列拾取的多路语音信号作两次语音唤醒信号识别,大大降低了误唤醒率,提升了用户体验。
附图说明
图1是本发明实施例一中的远场语音唤醒方法的流程图;
图2是本发明实施例二中的远场语音唤醒方法的流程图;
图3是本发明实施例三中的远场语音唤醒设备的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710853952.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语音交互方法、装置及设备
- 下一篇:语音识别方法和装置