[发明专利]一种指向信息引导的实时语音分离方法和装置有效

专利信息
申请号: 202110963498.1 申请日: 2021-08-20
公开(公告)号: CN113628634B 公开(公告)日: 2023-10-03
发明(设计)人: 何平;蒋升 申请(专利权)人: 随锐科技集团股份有限公司
主分类号: G10L21/0272 分类号: G10L21/0272
代理公司: 北京兴智翔达知识产权代理有限公司 11768 代理人: 郭卫芹
地址: 100192 北京市海淀区宝*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 指向 信息 引导 实时 语音 分离 方法 装置
【权利要求书】:

1.一种指向信息引导的实时语音分离方法,应用于基于麦克风阵列的系统,其特征在于,包括以下步骤:

S1:对每个麦克风的时域信号进行导向矢量与指向滤波器初始化;

S2:对初始化后的信号进行时频分解,完成从时域信号到时频域信号的变换;

S3:对时频域信号进行分离滤波器计算,获取用于分离目标语音与剩余信号的滤波器;

S4:根据获取的滤波器,得到目标语音的时频域信号,进而得到目标语音时域信号。

2.根据权利要求1所述的指向信息引导的实时语音分离方法,其特征在于,所述步骤S1之前还包括:获取每个麦克风的时域信号xm(n);

所述步骤S1中,进行导向矢量的方法如下:对每个频带k,计算导向矢量u(k),

q(θ)=[cos(θ),sin(θ)]

其中,fk为第k个频带的频率,k=1,2,...K;c为声速,c=340m/s;dm为第m个麦克风的二维坐标值;q(θ)为方向矢量,ωk为频带圆频率;

进行指向滤波器初始化的方法如下:对每个频带k计算超指向滤波器h(k):

其中,R(k)代表均匀散射场的各个麦克风关于拾取信号归一化的自相关系数。

3.根据权利要求2所述的指向信息引导的实时语音分离方法,其特征在于,所述步骤S2包括:

S201:对时域信号xm(n)进行短时傅里叶变换得到时频域表达:

其中,N为帧长,N=512;w(n)为长度512的汉明窗,l为时间帧序号,k为频率序号;Xm(l,k)为第m个麦克风信号,在第l帧,第k个频带的频谱;

S202:对每一个频带k,构建一个频域原始向量X(l,k):

X(l,k)=[X1(l,k),X2(l,k),...,XM(l,k)]T

4.根据权利要求3所述的指向信息引导的实时语音分离方法,其特征在于,所述步骤S3包括:

S301:计算帧级别分离引导因子:

其中,r1(l)和r2(l)分别用于引导目标语音与剩余信号;

S302:计算每一个频带的分离引导矩阵:

ψ1(k)=αψ1(k)+(1-α)r1(l)X(l,k)XH(l,k)

ψ2(k)=αψ1(k)+(1-α)r1(l)X(l,k)XH(l,k)

其中,ψ1(k)和ψ2(k)分别代表目标语音与剩余信号的引导矩阵;α为平滑因子,取值范围为0到1;

S303:为分离目标语音与剩余信号的滤波器构建新的优化函数,优化函数如下:

其中,G1(k)和G2(k)分别为分离目标语音与剩余信号的滤波器

S304:最小化优化函数,得到最优的滤波器;

所述最小化优化函数的过程为求解以下方程:

Ψ(k)G(k)=ρ(k)

其中,

滤波器G(k)可以求解为:

G(k)=Ψ-1(k)ρ(k)。

5.根据权利要求4所述的指向信息引导的实时语音分离方法,其特征在于,所述步骤S4包括:

S401:根据求解得到的滤波器,进而得到目标语音的频域估计:

S402:进行傅里叶逆变换得到目标语音时域估计:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于随锐科技集团股份有限公司,未经随锐科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110963498.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top