[发明专利]语音识别方法、装置、电子设备及计算机可读存储介质有效
申请号: | 202010185078.0 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111402868B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 欧阳能钧;许峻华;宋政斌;杨丹青;徐刚 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/22;G10L21/0216 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
1.一种语音识别方法,其特征在于,包括:
根据预设时间段内的第一麦克风信号和第一参考信号进行时延估计,得到时延值;
获取系统音频信号,并利用所述时延值对所述系统音频信号进行处理,得到第二参考信号;
根据所述第二参考信号对采集的第二麦克风信号进行消噪处理,得到待识别语音信号;
对所述待识别语音信号进行识别。
2.根据权利要求1所述的方法,其特征在于,所述根据预设时间段内的第一麦克风信号和第一参考信号进行时延估计,得到时延值,包括:
循环执行以下过程,直至得到的第一时延值满足预设收敛条件:
利用当前时间段的第一参考信号对在所述当前时间段采集的第一麦克风信号进行回声消噪处理,得到消噪后的信号;
根据所述当前时间段内的第一参考信号、第一麦克风信号和消噪后的信号进行时延估计,得到第一时延值;
其中,所述当前时间段的第一参考信号是:利用前一个时间段内得到的第一时延值对所述当前时间段的系统音频信号进行处理得到。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
当检测到出现新的时延值时,重新执行所述循环的过程,得到新的时延值,并利用所述新的时延值对相应系统音频信号进行处理,得到第三参考信号,并根据所述第三参考信号对采集的第三麦克风信号进行消噪处理,得到待识别语音信号。
4.根据权利要求1所述的方法,其特征在于,所述利用所述时延值对所述系统音频信号进行处理,得到第二参考信号,包括:
将所述系统音频信号缓存所述时延值后,得到所述第二参考信号。
5.根据权利要求1至4中任一项所述的方法,其特征在于,所述获取系统音频信号之后,所述方法还包括:
将所述系统音频信号输出给车载终端,以使所述车载终端播放所述系统音频信号;
其中,所述第二麦克风信号包括由麦克风采集的所述车载终端播放的音频信号。
6.一种语音识别装置,其特征在于,包括:
时延估计模块,用于根据预设时间段内的第一麦克风信号和第一参考信号进行时延估计,得到时延值;
第一处理模块,用于获取系统音频信号,并利用所述时延值对所述系统音频信号进行处理,得到第二参考信号;
第二处理模块,用于根据所述第二参考信号对采集的第二麦克风信号进行处理,得到待识别语音信号;
识别模块,用于对所述待识别语音信号进行识别。
7.根据权利要求5所述的装置,其特征在于,
所述时延估计模块具体用于:循环执行以下过程,直至得到的第一时延值满足预设收敛条件:
利用当前时间段的第一参考信号对在所述当前时间段采集的第一麦克风信号进行回声消噪处理,得到消噪后的信号;
根据所述当前时间段内的第一参考信号、第一麦克风信号和消噪后的信号进行时延估计,得到第一时延值;
其中,所述当前时间段的第一参考信号是:利用前一个时间段内得到的第一时延值对所述当前时间段的系统音频信号进行处理得到。
8.根据权利要求7所述的装置,其特征在于,
所述时延估计模块还用于:当检测到出现新的时延值时,重新执行所述循环的过程,得到新的时延值;
所述第一处理模块还用于:利用所述新的时延值对相应系统音频信号进行处理,得到第三参考信号;
所述第二处理模块还用于:根据所述第三参考信号对采集的第三麦克风信号进行消噪处理,得到待识别语音信号。
9.根据权利要求6所述的装置,其特征在于,
所述第一处理模块具体用于:将所述系统音频信号缓存所述时延值后,得到所述第二参考信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010185078.0/1.html,转载请声明来源钻瓜专利网。