[发明专利]一种声源跟踪定位方法、装置、设备和计算机可读存储介质有效
申请号: | 201710742839.6 | 申请日: | 2017-08-25 |
公开(公告)号: | CN107516526B | 公开(公告)日: | 2022-09-06 |
发明(设计)人: | 高聪 | 申请(专利权)人: | 百度在线网络技术(北京)有限公司 |
主分类号: | G10L17/02 | 分类号: | G10L17/02;G10L15/22;G10L15/26;G06F3/16;H04L67/52 |
代理公司: | 北京品源专利代理有限公司 11332 | 代理人: | 孟金喆 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声源 跟踪 定位 方法 装置 设备 计算机 可读 存储 介质 | ||
本发明实施例公开了一种声源跟踪定位方法、装置、设备和计算机可读存储介质。该方法包括:接收用户语音指令;依据预设的设备唤醒位置确定是否发生位置变更;若发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;将所述用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应所述用户语音指令;否则,屏蔽所述用户语音指令。本发明实施例提供的技术方案,当用户更换了位置后,能够主动屏蔽掉其他用户发送的语音请求,直接跟踪到唤醒终端的用户发送的语音请求,并进行响应提供相应的语音服务。实现了用户在频繁移动的场景下无需再次输出预设文本的引导音来唤醒智能终端响应语音服务,大大提高了语音服务的处理效率。
技术领域
本发明实施例涉及语音识别技术领域,尤其涉及一种声源跟踪定位方法、装置、设备和计算机可读存储介质。
背景技术
近年来,随着语音识别技术的广泛普及,越来越多的用户通过语音来控制智能终端为自身的生活需求提供服务,但是在这之前,首先需要唤醒智能终端。
目前,现有的智能终端是通过用户发送预设的文本的引导音,例如“小度,小度”来唤醒智能终端,智能终端通过引导音对该用户进行定位,进而,当接收从该位置发送的语音请求时,解析所述语音请求获取用户的服务需求,并为用户提供相应的服务。当用户发生位置变更后再次发送语音服务指令之前,需要再次发送引导音,重新唤醒智能终端,进而输出后续的语音请求。
由此可见,现有技术是通过每次预设的文本引导音来唤醒智能终端,进行对用户定位后响应后续的语音请求,如果用户移动更换了位置,需要再次发送的引导音唤醒智能终端响应后续的语音请求。因此,针对用户频繁移动的场景,大大降低了语音处理效率。
发明内容
本发明实施例提供一种声源跟踪定位方法、装置、设备和计算机可读存储介质,可以实现用户在频繁移动的场景下无需再次输出预设文本的引导音来唤醒智能终端响应语音服务,大大提高了语音服务的处理效率。
第一方面,本发明实施例提供了一种声源跟踪定位方法,该方法包括:
接收用户语音指令;
依据预设的设备唤醒位置确定是否发生位置变更;
若发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;
将所述用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应所述用户语音指令;否则,屏蔽所述用户语音指令。
第二方面,本发明实施例还提供了一种声源跟踪定位装置,该装置包括:
语音指令接收模块,用于接收用户语音指令;
位置变更确定模块,用于依据预设的设备唤醒位置确定是否发生位置变更;
声纹特征提取模块,用于若预设的设备唤醒位置发生位置变更,则从所述用户语音指令中提取得到用户声纹特征;
声纹特征匹配模块,用于将所述用户声纹特征与预设的样本声纹特征进行匹配,若匹配成功,则响应所述用户语音指令;否则,屏蔽所述用户语音指令。
第三方面,本发明实施例还提供了一种设备,该设备包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,
当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一方面中任一所述的声源跟踪定位方法。
第四方面,本发明实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现第一方面中任一所述的声源跟踪定位方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于百度在线网络技术(北京)有限公司,未经百度在线网络技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710742839.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:番茄全自动采摘装筐一体机
- 下一篇:用于秸秆打捆机的打扣器