[发明专利]远场自动语音识别预处理在审
| 申请号: | 201780029587.0 | 申请日: | 2017-05-16 |
| 公开(公告)号: | CN109074816A | 公开(公告)日: | 2018-12-21 |
| 发明(设计)人: | A·库普里亚诺夫;P·玛兹斯基;L·库里洛 | 申请(专利权)人: | 英特尔公司 |
| 主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L19/26;G10L21/0216 |
| 代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 李炜;黄嵩泉 |
| 地址: | 美国加利*** | 国省代码: | 美国;US |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 波束 音频通道 预处理 自动语音识别 混响 去除 分区 过滤音频信号 预处理流水线 输出接口 外部实体 音频信号 噪声水平 远场 | ||
1.一种用于自动语音识别预处理的系统,所述系统包括:
采样器,所述采样器用于获得多个音频通道;
去混响器,所述去混响器用于从所述多个音频通道去除混响;
波束形成器处理器,所述波束形成器处理器用于在去除混响后将所述多个音频通道划分为多个波束;
流选择器,所述流选择器用于基于噪声水平选择与所述多个波束中的波束相对应的分区;
过滤器,所述过滤器用于降低来自所选分区的语音信号中的噪声水平;以及
控制器,所述控制器用于经由预处理流水线的输出接口向外部实体提供音频信号。
2.如权利要求1所述的系统,包括回声消除块,所述回声消除块设置在所述去混响器与所述波束形成器处理器之间,以用于:在所述混响被去除之后并且在所述多个音频通道被划分为多个波束之前,消除来自所述多个音频通道的回声。
3.如权利要求1所述的系统,其特征在于,为了将所述多个音频通道划分为多分波束,所述波束形成器处理器用于:
接收所述多个音频通道;
基于产生所述多个音频通道的麦克风之间的关系,将所述多个音频通道划分成两个音频通道的分区;以及
将每个分区提供给基于相位的波束形成器。
4.如权利要求1所述的系统,其特征在于,为了基于噪声水平选择与波束相对应的分区,所述流选择器用于:
比较所述多个波束之间的噪声水平;以及
基于具有从所述比较确定的最低噪声水平来选择波束。
5.如权利要求4所述的系统,其特征在于,所述流选择器使用所述流选择器的短语质量记分器来比较所述多个波束之间的噪声水平。
6.如权利要求1所述的系统,其特征在于,为了降低来自所选分区的语音信号中的噪声水平,所述过滤器将降噪应用于所述音频信号。
7.如权利要求1所述的系统,其特征在于,为了降低来自所选分区的语音信号中的噪声水平,所述过滤器将频谱分布匹配(SPM)应用于所述音频信号。
8.如权利要求7所述的系统,其特征在于,在将降噪应用于所述音频信号之后,应用所述频谱分布匹配。
9.如权利要求1所述的系统,其特征在于,为了降低来自所选分区的语音信号中的噪声水平,所述过滤器将自动增益控制应用于所述音频信号。
10.如权利要求9所述的系统,其特征在于,在将频谱分布匹配应用于所述音频信号之后,应用所述自动增益控制。
11.一种用于自动语音识别预处理的方法,所述方法包括:
获得多个音频通道;
从所述音频通道去除混响;
在去除所述混响后,将所述多个音频通道划分为多个波束;
基于噪声水平选择与所述多个波束中的波束相对应的分区;
对来自所选分区的语音信号进行过滤;以及
经由预处理流水线的输出接口向外部实体提供经过滤的音频信号。
12.如权利要求11所述的方法,包括:在所述混响被去除之后并且在所述多个音频通道被划分为多个波束之前,从所述多个音频通道消除回声。
13.如权利要求11所述的方法,其特征在于,将所述多个音频通道划分为多个波束包括:
在波束形成器处理器处接收所述多个音频通道;
基于产生所述多个音频通道的麦克风之间的关系,将所述多个音频通道划分成两个音频通道的分区;以及
将每个分区提供给基于相位的波束形成器。
14.如权利要求11所述的方法,其特征在于,基于噪声水平选择对应于波束的分区包括:比较所述多个波束之间的语音水平;以及基于具有从所述比较确定的最高语音水平来选择波束。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于英特尔公司,未经英特尔公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780029587.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:抑制或减少风湍流效应
- 下一篇:语音增强方法、装置、设备及存储介质





