[发明专利]语音交互方法、装置及设备有效

申请号：	201710719307.0	申请日：	2017-08-21
公开（公告）号：	CN107464564B	公开（公告）日：	2023-05-26
发明（设计）人：	王辉	申请（专利权）人：	腾讯科技（深圳）有限公司
主分类号：	G10L15/22	分类号：	G10L15/22;G10L15/30;G10L15/20;G10L15/06;G10L21/0208;G10L21/0232
代理公司：	北京三高永信知识产权代理有限责任公司 11138	代理人：	刘映东
地址：	518057 广东省深圳***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音交互方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明实施例公开了一种语音交互方法、装置及设备，属于语音处理领域。该方法包括：根据两个麦克风分别接收到的唤醒信号确定音源方位，唤醒信号是预先设置的用于唤醒语音交互设备进行工作的信号；根据音源方位，通过两个麦克风定向接收语音信号；对语音信号进行降噪处理，并以便通过识别模型对降噪处理后的语音信号进行语音识别和语义分析，并生成相应的交互数据；根据交互数据执行相应的交互操作。本发明实施例在确保语音识别准确率的前提下，降低了语音交互设备的成本；并降低了信号处理的难度和复杂度，进而提高语音交互的速率。

技术领域

本发明实施例涉及语音处理领域，特别涉及一种语音交互方法、装置及设备。

背景技术

随着语音识别技术的不断发展，越来越多的语音交互设备应运而生。通过与语音交互设备进行语音交互，人们可以指示语音交互设备完成诸如音乐播放、天气播报等操作。

实际使用过程中，用户通常在距离语音交互设备较远处发出语音指令，即用户与语音交互设备进行远场交互。为了提高远场交互时语音信号的接收质量，进而提高后续语音识别的准确度，语音交互设备上通常阵列设置有多个用于收音的麦克风。比如，语音交互设备的顶面被设计成平面，用于收音的多个麦克风即以环形阵列的方式设置在顶面。语音交互设备通过麦克风阵列接收到语音信号后，即对语音信号进行识别，从而根据识别结果与用户进行交互。

然而，在语音交互设备上阵列设置多个麦克风的成本较高，且语音交互设备同时对多路语音信号进行处理的难度及复杂度较高，导致语音交互存在滞后性。

发明内容

为了解决语音交互设备上阵列设置多个麦克风的成本较高，且语音交互设备同时对多路语音信号进行处理的难度及复杂度较高，导致语音交互存在滞后性。的问题，本发明实施例提供了一种语音交互方法、装置及设备。所述技术方案如下：

根据本发明实施例的第一方面，提供了一种语音交互方法，用于设置有两个麦克风的语音交互设备，该方法包括：

根据两个麦克风分别接收到的唤醒信号确定音源方位，唤醒信号是预先设置的用于唤醒语音交互设备进行工作的信号；

根据音源方位，通过两个麦克风定向接收语音信号；

对语音信号进行降噪处理，并以便通过识别模型对降噪处理后的语音信号进行语音识别和语义分析，并生成相应的交互数据；

根据交互数据执行相应的交互操作。

根据本发明实施例的第二方面，提供了一种语音交互装置，用于设置有两个麦克风的语音交互设备，该装置包括：

确定模块，用于根据两个麦克风分别接收到的唤醒信号确定音源方位，唤醒信号是预先设置的用于唤醒语音交互设备进行工作的信号；

第一收音模块，用于根据音源方位，通过两个麦克风定向接收语音信号；

第一处理模块，用于对语音信号进行降噪处理，以便通过识别模型对降噪处理后的语音信号进行语音识别和语义分析，并生成相应的交互数据；