[发明专利]一种基于双麦克风阵列的目标语音提取方法在审
| 申请号: | 202110630288.0 | 申请日: | 2021-06-07 |
| 公开(公告)号: | CN113096684A | 公开(公告)日: | 2021-07-09 |
| 发明(设计)人: | 曾帆 | 申请(专利权)人: | 成都启英泰伦科技有限公司 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/0216;G10L15/20;G10L15/05;G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 610041 四川省成都市高*** | 国省代码: | 四川;51 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 麦克风 阵列 目标 语音 提取 方法 | ||
一种基于双麦克风阵列的目标语音提取方法,包括如下步骤:S1.将两个麦克风接收的时域信号转化为频域信号;S2.然后对频域信号进行频域盲源分离算法处理;处理后得到两个源信号的估计信号;S3.利用两个源信号的估计信号求出各自的累加语音存在概率和功率谱值,并根据语音存在概率和功率谱值选择概率值高和功率谱值大的估计信号作为目标语音传输到后端语音识别系统进行识别。本发明对盲源分离算法分离后的两个信号通过语音存在概率和功率谱值的综合比较,提取出目标语音信号;该方法相对传统方法,不需要利用DOA提供目标声源先验信息,且不需要采用深度学习方法提取,对系统资源要求降低。
技术领域
本发明属于人工智能技术领域,涉及语音提取技术,具体涉及一种基于双麦克风阵列的目标语音提取方法。
背景技术
在人工智能技术领域,语音增强、语音识别一直都是专家学者及语音交互产品市场关注的热点话题。其中,双麦克风阵列以其显而易见的优势成为技术人员研究的主要对象。原因在于相比于单麦克风,双麦克风阵列在降噪处理及远距离拾音等方面具有较大优势;而与多麦克风阵列相比,双麦克风阵列又极大简化了语音交互产品的硬件设计方案及语音前端算法处理的复杂度。因此,双麦克风阵列以其小巧灵活的构型以及电路、算力、成本要求都比较低而广泛应用于智能家居、智能家电、智能玩具等领域。
在语音增强技术上,基于双麦克风阵列的语音信号处理算法主要有基于波束形成的算法,如延时累加波束形成(Delay-Sum Beamforming,DSB)方法、最小方差无失真响应(Minimum Variance Distortionless Response,MVDR)波束形成方法等,基于盲源分离的算法以及基于深度学习的方法等。其中,基于盲源分离的算法相比于传统波束形成方法降噪效果好、相比于深度学习方法算力小,易集成在嵌入式系统上。因此,盲源分离算法在双麦克风阵列降噪处理上具有很好的应用前景。
虽然盲源分离算法在双麦降噪处理上可以取得较好的效果,但由于盲源分离算法只是将语音与噪声或者语音与干扰分离开,对于如何在盲源分离处理后提取目标语音仍是需要解决的难题。目前,对于目标语音的提取,主要的方法有基于目标声源的波达方向(Direction of Arrival,DOA)、基于深度学习的训练、基于音视频融合等方法。但是对于双麦克风而言,由于其麦克风数量较少,空间指向性较弱,利用DOA的方法会使目标语音提取时信号频谱失真甚至无法提取到目标语音,而深度学习的方法又对嵌入式系统的性能和资源要求较高。
发明内容
为克服现有方案技术存在的缺陷,本发明公开了一种基于双麦克风阵列的目标语音提取方法。
本发明所述基于双麦克风阵列的目标语音提取方法,其特征在于,包括如下步骤:
S1. 将两个麦克风接收的时域信号转化为频域信号;
S2. 然后对频域信号进行频域盲源分离算法处理;处理后得到两个源信号的估计信号;
S3. 利用两个源信号的估计信号求出各自的累加语音存在概率和功率谱值,并以功率谱值比值和概率值差值进行综合比较,设置不同的阈值范围,将功率谱值大和概率值高的信号作为目标语音传输到后端语音识别系统进行识别。
优选的:如果步骤S3中识别不成功,则更换另一估计信号进行识别。
优选的:所述S1步骤具体为:
S11.对时域信号做分帧加窗处理,设置每帧长度为K个采样点;
S12. 进行分帧加窗处理后的时域信号进行端点识别处理,检测输入信号是否为语音信号,是则进入下一步骤S13,否则终止进程;
S13.对时域信号进行短时傅里叶变换,得到频域信号。
优选的:所述S2步骤具体为:
S21.对双麦克风阵列,以2 * 2单位矩阵作为分离矩阵W(k,l)的初始化矩阵,对分离矩阵W(k,l)进行逐帧更新;即帧数增加1,更新一次;
W(k,l)的更新规则为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都启英泰伦科技有限公司,未经成都启英泰伦科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110630288.0/2.html,转载请声明来源钻瓜专利网。





