[发明专利]一种指向信息引导的实时语音分离方法和装置有效
申请号: | 202110963498.1 | 申请日: | 2021-08-20 |
公开(公告)号: | CN113628634B | 公开(公告)日: | 2023-10-03 |
发明(设计)人: | 何平;蒋升 | 申请(专利权)人: | 随锐科技集团股份有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 郭卫芹 |
地址: | 100192 北京市海淀区宝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 指向 信息 引导 实时 语音 分离 方法 装置 | ||
本发明公开了一种指向信息引导的实时语音分离方法和装置,属于信息处理的领域,该方法包括以下步骤:S1:对每个麦克风的时域信号进行导向矢量与指向滤波器初始化;S2:对初始化后的信号进行时频分解,完成从时域信号到时频域信号的变换;S3:对时频域信号进行分离滤波器计算,获取用于分离目标语音与剩余信号的滤波器;S4:根据获取的滤波器,得到目标语音的时频域信号,进而得到目标语音时域信号。本发明基于超指向滤波器构建实时IVA的初始估计,并且修正IVA的优化函数,保证分离算法可以快速收敛,并且准确提取目标语音信号。
技术领域
本发明属于信息处理的领域,具体涉及一种指向信息引导的实时语音分离方法和装置。
背景技术
目前,麦克风阵列波束形成技术广泛应用于在线会议系统、车载人机交互、智能家居等领域。实际环境中,存在显著的噪声、竞争说话人等干扰,会显著降低会议通讯的听感和后续语音识别的准确率。基于麦克风阵列多阵元进行波束生成是降低信号噪声、提高通讯质量最常用的方法。如何有针对性的提取某一个方向的语音信号,同时显著压制其他噪声,对提升会议通讯质量、提升语音识别率等有重要意义。
基于独立矢量分析(Independent vector analysis,IVA)是目前最常用的语音分离/拾取技术。首先把所有阵元拾取的时域信号通过短时傅里叶变化转化到时频域,随后基于分离语音互熵最小的原则构建优化函数,基于该优化函数迭代更新分离矩阵,估计出分离矩阵之后,可以得到目标信号的频域估计,最后基于傅里叶逆变换得到时域估计。最新的一些IVA方法中,通过增加了分离矩阵与目标方向导向矢量的距离约束,使得IVA分离结果可以实时提取目标方语音。
现有技术的主要缺点如下:
1)现有的方向性IVA通过直接增加分离矩阵与导向矢量距离的约束,由于导向矢量在混响场景下准确度大大下降,导致在混响场景下性能显著不足。
2)方向性IVA技术在初始估计上不做约束,导致收敛时间过长,如果环境发生变化,比如干扰说话人在走动,会导致IVA分离矩阵收敛速度跟不上声学环境变化的速度。
有鉴于此,特提出本发明。
发明内容
本发明的目的是提供一种指向信息引导的实时语音分离方法和装置,其基于超指向滤波器构建实时IVA的初始估计,并且修正IVA的优化函数,保证分离算法可以快速收敛,并且准确提取目标方语音信号。
为了实现上述目的,本发明提供的一种指向信息引导的实时语音分离方法,应用于基于麦克风阵列的系统,包括以下步骤:
S1:对每个麦克风的时域信号进行导向矢量与指向滤波器初始化;
S2:对初始化后的信号进行时频分解,完成从时域信号到时频域信号的变换;
S3:对时频域信号进行分离滤波器计算,获取用于分离目标语音与剩余信号的滤波器;
S4:根据获取的滤波器,得到目标语音的时频域信号,进而得到目标语音时域信号。
进一步地,所述步骤S1之前还包括:获取每个麦克风的时域信号xm(n);
所述步骤S1中,进行导向矢量的方法如下:对每个频带k,计算导向矢量u(k),
q(θ)=[cos(θ),sin(θ)]
其中,fk为第k个频带的频率,k=1,2,...K;c为声速,c=340m/s;dm为第m个麦克风的二维坐标值;q(θ)为方向矢量,ωk为频带圆频率;
进行指向滤波器初始化的方法如下:对每个频带k计算超指向滤波器h(k):
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于随锐科技集团股份有限公司,未经随锐科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110963498.1/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置