[发明专利]语音识别方法、装置、电子设备及计算机可读存储介质有效
申请号: | 202010185078.0 | 申请日: | 2020-03-17 |
公开(公告)号: | CN111402868B | 公开(公告)日: | 2023-10-24 |
发明(设计)人: | 欧阳能钧;许峻华;宋政斌;杨丹青;徐刚 | 申请(专利权)人: | 阿波罗智联(北京)科技有限公司 |
主分类号: | G10L15/20 | 分类号: | G10L15/20;G10L15/22;G10L21/0216 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;黄灿 |
地址: | 100176 北京市大兴区北京经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 识别 方法 装置 电子设备 计算机 可读 存储 介质 | ||
本申请公开了一种语音识别方法、装置、电子设备及计算机可读存储介质,涉及语音识别技术领域。具体实现方案为:根据预设时间段内的第一麦克风信号和第一参考信号进行时延估计,得到时延值;获取系统音频信号,并利用所述时延值对所述系统音频信号进行处理,得到第二参考信号;根据所述第二参考信号对采集的第二麦克风信号进行消噪处理,得到待识别语音信号;对所述待识别语音信号进行识别。根据本申请中方案,可以增强语音识别效果。
技术领域
本申请涉及语音识别技术领域,尤其涉及一种语音识别方法、装置、电子设备及计算机可读存储介质。
背景技术
随着人们对出行舒适度的要求越来越高,传统的前装汽车电子已经不能满足人们的需求。而车机互联可以有效弥补导航、音乐、语音等出行需求,因此,车机互联逐渐被人们接受。但在车机互联的情况下,由于车载终端播放音频时的传输时延较多,将会造成现有识别输入语音时的降噪方式无法满足降噪需求,导致语音识别效果差。
发明内容
本申请实施例提供一种语音识别方法、装置、电子设备及计算机可读存储介质,以解决现有技术中的语音识别效果差的问题。
为了解决上述技术问题,本申请是这样实现的:
第一方面,本申请实施例提供了一种语音识别方法,包括:
根据预设时间段内的第一麦克风信号和第一参考信号进行时延估计,得到时延值;
获取系统音频信号,并利用所述时延值对所述系统音频信号进行处理,得到第二参考信号;
根据所述第二参考信号对采集的第二麦克风信号进行消噪处理,得到待识别语音信号;
对所述待识别语音信号进行识别。
这样,可以借助时延估计得到的时延值,来获取用于消噪处理的参考信号,从而保证参考信号与相应麦克风信号的对齐,增强对麦克风信号的消噪处理效果,从而增强该麦克风信号中语音信号的识别效果。
可选的,所述根据预设时间段内的第一麦克风信号和第一参考信号进行时延估计,得到时延值,包括:
循环执行以下过程,直至得到的第一时延值满足预设收敛条件:
利用当前时间段的第一参考信号对在所述当前时间段采集的第一麦克风信号进行回声消噪处理,得到消噪后的信号;
根据所述当前时间段内的第一参考信号、第一麦克风信号和消噪后的信号进行时延估计,得到第一时延值;
其中,所述当前时间段的第一参考信号是:利用前一个时间段内得到的第一时延值对所述当前时间段的系统音频信号进行处理得到。
这样,借助上述循环过程,可以获得稳定的且准确度高的时延值,从而保证后续获取的参考信号与相应麦克风信号的对齐。
可选的,所述方法还包括:
当检测到出现新的时延值时,重新执行所述循环的过程,得到新的时延值,并利用所述新的时延值对相应系统音频信号进行处理,得到第三参考信号,并根据所述第三参考信号对采集的第三麦克风信号进行消噪处理,得到待识别语音信号。
这样,可以自适应的随着时延值的变化而快速获得新的时延值,从而保证后续获取的参考信号与相应麦克风信号的对齐。
可选的,所述利用所述时延值对所述系统音频信号进行处理,得到第二参考信号,包括:
将所述系统音频信号缓存所述时延值后,得到所述第二参考信号。
这样,借助缓存过程,可以简单方便获得所需的参考信号。
可选的,所述获取系统音频信号之后,所述方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿波罗智联(北京)科技有限公司,未经阿波罗智联(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010185078.0/2.html,转载请声明来源钻瓜专利网。