[发明专利]处理来自分布式麦克风的语音在审
申请号: | 201780029399.8 | 申请日: | 2017-05-12 |
公开(公告)号: | CN109155130A | 公开(公告)日: | 2019-01-04 |
发明(设计)人: | M·J·戴利;D·R·克里斯特;W·贝拉迪 | 申请(专利权)人: | 伯斯有限公司 |
主分类号: | G10L15/22 | 分类号: | G10L15/22;H04R29/00;H04S7/00;G10L15/30 |
代理公司: | 北京市金杜律师事务所 11256 | 代理人: | 王茂华 |
地址: | 美国马*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 麦克风 音频信号 导出 调度系统 输出设备 置信度 响应 位置处 捕获 语音 输出 通信 | ||
本发明公开了定位在不同位置处的多个麦克风。与所述麦克风通信的调度系统从所述多个麦克风导出多个音频信号,计算每个导出的音频信号的置信度得分,比较所述计算的置信度得分。基于所述比较,所述调度系统选择所述导出的音频信号中的至少一个,以用于进一步处理,接收对所述进一步处理的响应,并且使用输出设备输出所述响应。所述输出设备不与捕获了所述所选音频信号的所述麦克风对应。
本申请要求2016年5月13日提交的临时美国专利申请62/335,981和2016年8月16日提交的临时美国专利申请62/375,543的优先权,这些临时美国专利申请的全部内容以引用方式并入本文。本申请涉及2016年12月9日提交的美国专利申请15/373,541,该美国专利申请的全部内容以引用方式并入本文。
技术背景
本公开涉及处理来自分布式麦克风的语音。
当前语音识别系统假定一个麦克风或麦克风阵列正在侦听用户说话并且基于语音采取动作。该动作可包括本地语音识别和响应、基于云的识别和响应或这些的组合。在一些情况下,本地识别“唤醒字词”,并且基于该唤醒字词远程地提供进一步的处理。
分布式扬声器系统可协调定位在家庭周围的多个扬声器处的音频回放,使得声音回放在各位置之间同步。
发明内容
一般来讲,在一个方面,系统包括定位在不同位置处的多个麦克风以及与麦克风通信的调度系统。调度系统从多个麦克风导出多个音频信号,计算每个导出的音频信号的置信度得分,并且比较计算的置信度得分。基于该比较,调度系统选择导出的音频信号中的至少一个,以用于进一步处理。
具体实施可以任何组合包括以下各项中的一者或多者。调度系统可包括多个本地处理器,该多个本地处理器各自连接到麦克风中的至少一个。调度系统可包括至少第一本地处理器以及在网络上可用于第一处理器的至少第二处理器。计算每个导出的音频信号的置信度得分可包括计算信号是否可包括语音、信号中是否可包括唤醒字词、信号中可包括哪种唤醒字词、包括在信号中的语音的质量、其声音可被记录在信号中的用户的身份以及用户相对于麦克风位置的位置中的一者或多者中的置信度。计算每个导出的音频信号的置信度得分可包括确定音频信号表现为包括话语以及该话语是否包括唤醒字词。计算每个导出的音频信号的置信度得分可还包括识别语音中包括多个唤醒字词中的哪个唤醒词。计算每个导出的音频信号的置信度得分还可包括确定语音包括唤醒字词的置信度的程度。
计算每个导出的音频信号的置信度得分可包括比较麦克风检测到与每个音频信号对应的声音、导出的音频信号的信号强度、导出的音频信号的信噪比、导出的音频信号的频谱内容以及导出的音频信号内的回响的时间之间的时序中的一个或多个。计算每个导出的音频信号的置信度得分可包括针对每个音频信号,计算音频信号的表观源与麦克风中的至少一个之间的距离。计算每个导出的音频信号的置信度得分可包括计算每个音频信号源相对于麦克风位置的位置。计算每个音频信号源的位置可包括基于计算的每个源与麦克风中的至少两个之间的距离来对该位置进行三角测量。
调度系统可将所选的一个或多个信号中的至少一部分传输到语音处理系统,以提供进一步处理。传输所选的一个或多个音频信号可包括从多个语音处理系统中选择至少一个语音处理系统。多个语音处理系统中的至少一个语音处理系统可包括在广域网上提供的语音识别服务。多个语音处理系统中的至少一个语音处理系统可包括语音识别方法,所述语音识别方法在执行调度系统的相同处理器上执行。语音处理系统的选择可基于与用户相关联的偏好、计算的置信度得分或导出音频信号所处的情景中的一者或多者。情景可包括对可能正在讲话的用户的识别、多个麦克风中哪个麦克风产生了所选的导出音频信号、用户相对于麦克风位置的位置、系统中的其他设备的操作状态以及当天时刻中的一者或多者。语音处理系统的选择可基于可用于语音处理系统的资源。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于伯斯有限公司,未经伯斯有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780029399.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:语言程控系统
- 下一篇:通过对话进行设备标识