[发明专利]一种定向麦克风阵列拾音降噪方法及装置在审
申请号: | 202010786357.2 | 申请日: | 2020-08-07 |
公开(公告)号: | CN111883160A | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 陈晓松;李旭滨 | 申请(专利权)人: | 上海茂声智能科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L15/18;G10L15/22 |
代理公司: | 上海领誉知识产权代理有限公司 31383 | 代理人: | 车超平;王琰 |
地址: | 201306 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 定向 麦克风 阵列 拾音降噪 方法 装置 | ||
本申请涉及一种定向麦克风阵列拾音降噪方法及装置,该方法包括获取原始语音信息;对原始语音信息进行降噪处理,消除在预设角度范围之外的干扰信号,以生成降噪语音信息;对降噪语音信息进行清晰化处理,以生成清晰语音信息;识别清晰语音信息,以获取第一语义信息,解决了无法对干扰信号处理导致语音识别不准确的问题,实现了消除干扰信号、提高语音识别准确率的技术效果。
技术领域
本申请涉及语音降噪技术领域,特别是涉及一种定向麦克风阵列拾音降噪方法及装置。
背景技术
在噪杂场景中,如地铁站厅,用户在进行语音购票或语音问询时,会出现因外界噪声干扰大,导致无法进行流畅语音交互的问题。
在相关技术中,为了减少外界噪声对语音识别的影响,通常使用等间距麦克风阵列以及配套的语音降噪算法对原始语音音频进行降噪处理,从而提高语音识别的准确率。其具体流程如下:等间距麦克风阵列录入多路音频,降噪算法对多路音频进行处理,从而得到单路降噪音频,将该单路降噪音频送入语音识别引擎进行识别,获得语音识别结果后用于语音交互。
然而,在地铁站厅中,多个地铁售票机相邻设置,邻近地铁售票机的用户对话、过往的旅客和工作人员的说话、以及地铁站内广播都会对用户语音购票或语音问询造成干扰。上述降噪算法无法对干扰信号进行处理,导致在后续的语音识别阶段产生大量的误识别。
目前针对相关技术中无法对干扰信号进行处理导致语音识别不准确的问题,尚未提出有效的解决方案。
发明内容
本申请实施例提供了一种定向麦克风阵列拾音降噪方法及装置,以至少解决相关技术中无法对干扰信号处理导致语音识别不准确的问题。
第一方面,本申请实施例提供了一种定向麦克风阵列拾音降噪方法,应用于躁杂场景,包括:
获取原始语音信息;
对所述原始语音信息进行降噪处理,消除在预设角度范围之外的干扰信号,以生成降噪语音信息;
对所述降噪语音信息进行清晰化处理,以生成清晰语音信息;
识别所述清晰语音信息,以获取第一语义信息。
在其中的一些实施例中,对所述原始语音信息进行降噪处理包括:
利用超指向性波束形成算法对所述原始语音信息进行降噪处理,消除在预设角度范围之外的干扰信号,以生成第一过渡语音信息;
利用广义旁瓣相消算法对所述第一过渡语音信息进行增强处理,以生成降噪语音信息。
在其中的一些实施例中,对所述降噪语音信息进行清晰化处理,以生成清晰语音信息包括:
对所述降噪语音信息进行回声消除处理,消除回声信号,以生成第二过渡语音信息;
对所述第二过渡语音信息进行去混响处理,消除混响信号,以生成清晰语音信息。
在其中的一些实施例中,对所述降噪语音信息进行清晰化处理,以生成清晰语音信息包括:
对所述降噪语音信息进行去混响处理,消除混响信号,以生成第二过渡语音信息;
对所述第二过渡语音信息进行回声消除处理,消除回声信号,以生成清晰语音信息。
在其中的一些实施例中,对所述原始语音信息进行降噪处理,消除在预设角度范围之外的干扰信号,以生成降噪语音信息,还包括:
获取所述原始语音信息的第一信噪比以及所述降噪语音信息的第二信噪比;
在所述第二信噪比与所述第一信噪比的比值未达到第一预设阈值的情况下,对所述原始语音信息或所述降噪语音信息进行降噪处理,直至所述第二信噪比与所述第一信噪比的比值达到第一预设阈值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海茂声智能科技有限公司,未经上海茂声智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010786357.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种土壤污染治理装置
- 下一篇:一种具有可分离式防护穿线板的电气柜