[发明专利]一种指向信息引导的实时语音分离方法和装置有效

专利信息
申请号: 202110963498.1 申请日: 2021-08-20
公开(公告)号: CN113628634B 公开(公告)日: 2023-10-03
发明(设计)人: 何平;蒋升 申请(专利权)人: 随锐科技集团股份有限公司
主分类号: G10L21/0272 分类号: G10L21/0272
代理公司: 北京兴智翔达知识产权代理有限公司 11768 代理人: 郭卫芹
地址: 100192 北京市海淀区宝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 指向 信息 引导 实时 语音 分离 方法 装置
【说明书】:

发明公开了一种指向信息引导的实时语音分离方法和装置,属于信息处理的领域,该方法包括以下步骤:S1:对每个麦克风的时域信号进行导向矢量与指向滤波器初始化;S2:对初始化后的信号进行时频分解,完成从时域信号到时频域信号的变换;S3:对时频域信号进行分离滤波器计算,获取用于分离目标语音与剩余信号的滤波器;S4:根据获取的滤波器,得到目标语音的时频域信号,进而得到目标语音时域信号。本发明基于超指向滤波器构建实时IVA的初始估计,并且修正IVA的优化函数,保证分离算法可以快速收敛,并且准确提取目标语音信号。

技术领域

本发明属于信息处理的领域,具体涉及一种指向信息引导的实时语音分离方法和装置。

背景技术

目前,麦克风阵列波束形成技术广泛应用于在线会议系统、车载人机交互、智能家居等领域。实际环境中,存在显著的噪声、竞争说话人等干扰,会显著降低会议通讯的听感和后续语音识别的准确率。基于麦克风阵列多阵元进行波束生成是降低信号噪声、提高通讯质量最常用的方法。如何有针对性的提取某一个方向的语音信号,同时显著压制其他噪声,对提升会议通讯质量、提升语音识别率等有重要意义。

基于独立矢量分析(Independent vector analysis,IVA)是目前最常用的语音分离/拾取技术。首先把所有阵元拾取的时域信号通过短时傅里叶变化转化到时频域,随后基于分离语音互熵最小的原则构建优化函数,基于该优化函数迭代更新分离矩阵,估计出分离矩阵之后,可以得到目标信号的频域估计,最后基于傅里叶逆变换得到时域估计。最新的一些IVA方法中,通过增加了分离矩阵与目标方向导向矢量的距离约束,使得IVA分离结果可以实时提取目标方语音。

现有技术的主要缺点如下:

1)现有的方向性IVA通过直接增加分离矩阵与导向矢量距离的约束,由于导向矢量在混响场景下准确度大大下降,导致在混响场景下性能显著不足。

2)方向性IVA技术在初始估计上不做约束,导致收敛时间过长,如果环境发生变化,比如干扰说话人在走动,会导致IVA分离矩阵收敛速度跟不上声学环境变化的速度。

有鉴于此,特提出本发明。

发明内容

本发明的目的是提供一种指向信息引导的实时语音分离方法和装置,其基于超指向滤波器构建实时IVA的初始估计,并且修正IVA的优化函数,保证分离算法可以快速收敛,并且准确提取目标方语音信号。

为了实现上述目的,本发明提供的一种指向信息引导的实时语音分离方法,应用于基于麦克风阵列的系统,包括以下步骤:

S1:对每个麦克风的时域信号进行导向矢量与指向滤波器初始化;

S2:对初始化后的信号进行时频分解,完成从时域信号到时频域信号的变换;

S3:对时频域信号进行分离滤波器计算,获取用于分离目标语音与剩余信号的滤波器;

S4:根据获取的滤波器,得到目标语音的时频域信号,进而得到目标语音时域信号。

进一步地,所述步骤S1之前还包括:获取每个麦克风的时域信号xm(n);

所述步骤S1中,进行导向矢量的方法如下:对每个频带k,计算导向矢量u(k),

q(θ)=[cos(θ),sin(θ)]

其中,fk为第k个频带的频率,k=1,2,...K;c为声速,c=340m/s;dm为第m个麦克风的二维坐标值;q(θ)为方向矢量,ωk为频带圆频率;

进行指向滤波器初始化的方法如下:对每个频带k计算超指向滤波器h(k):

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于随锐科技集团股份有限公司,未经随锐科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110963498.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top