[发明专利]一种基于语音频谱域稀疏性约束的在线语音分离方法和装置在审
申请号: | 202111095119.8 | 申请日: | 2021-09-17 |
公开(公告)号: | CN113889139A | 公开(公告)日: | 2022-01-04 |
发明(设计)人: | 何平;蒋升 | 申请(专利权)人: | 随锐科技集团股份有限公司 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272 |
代理公司: | 北京兴智翔达知识产权代理有限公司 11768 | 代理人: | 郭卫芹 |
地址: | 100192 北京市海淀区宝*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 语音 频谱 稀疏 约束 在线 分离 方法 装置 | ||
1.一种基于语音频谱域稀疏性约束的在线语音分离方法,应用于基于麦克风阵列的系统,其特征在于,包括以下步骤:
S1:对每个麦克风的时域信号进行短时傅里叶变换得到时频域表达,并构建频域原始向量;
S2:根据目标语音相对麦克风阵列的方向,构建维度为2×M的初始化分离矩阵;
S3:构建优化函数,并计算用于分离目标语音与剩余信号的分离矩阵;
S4:根据计算的分离矩阵,得到目标语音的频域信号,进而得到目标语音时域信号。
2.根据权利要求1所述的基于语音频谱域稀疏性约束的在线语音分离方法,其特征在于,所述步骤S1之前还包括:获取每个麦克风的时域信号xm(n);
所述步骤S1包括:
对时域信号xm(n)进行短时傅里叶变换得到时频域表达:
对每一个频带k,构建一个频域原始向量X(l,k):
X(l,k)=[X1(l,k),X2(l,k),…,XM(l,k)]T。
3.根据权利要求2所述的基于语音频谱域稀疏性约束的在线语音分离方法,其特征在于,所述步骤S2中,初始化的分离矩阵为:
其中,目标语音分离矩阵初始化为:
q(θ)=[cos(θ),sin(θ)];
剩余信号分离矩阵初始化为0向量:
G2(0,k)=[0,0,....,0]。
4.根据权利要求3所述的基于语音频谱域稀疏性约束的在线语音分离方法,其特征在于,所述步骤S3包括:
S301:构建新的优化函数J(G(k)):
y1(l,k)=G1(k)X(l,k),y2(l,k)=G2(k)X(l,k)
其中,y1(l,k)和y2(l,k)分别代表基于分离矩阵得到目标语音和剩余信号频域估计;
S302:计算优化函数的梯度向量:
S303:根据上一帧分离矩阵和梯度下降法更新分离矩阵:
G1(l,k)=G1(l-1,k)-εΔ(G1(k))
G2(l,k)=G2(l-1,k)-εΔ(G2(k))
其中,G1(l,k)和G2(l,k)分别为用于分离目标语音与剩余信号的分离矩阵。
5.根据权利要求4所述的基于语音频谱域稀疏性约束的在线语音分离方法,其特征在于,所述步骤S4包括:
S401:根据求解得到的分离矩阵,得到目标语音的频域估计:
S402:对频域估计进行傅里叶逆变换得到目标语音的时域信号:
6.一种基于语音频谱域稀疏性约束的在线语音分离装置,应用于基于麦克风阵列的系统,其特征在于,包括初始化模块、信号分解模块、分离滤波器计算模块和目标语音估计模块:
初始化模块用于对每个麦克风的时域信号进行短时傅里叶变换得到时频域表达,并构建频域原始向量;
信号分解模块用于根据目标语音相对麦克风阵列的方向,构建维度为2×M的初始化分离矩阵;
分离滤波器计算模块用于构建优化函数,并计算用于分离目标语音与剩余信号的分离矩阵;
目标语音估计模块用于根据计算的分离矩阵,得到目标语音的频域信号,进而得到目标语音时域信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于随锐科技集团股份有限公司,未经随锐科技集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111095119.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:基于RFID的卷烟辅料防错校验方法
- 下一篇:一种主动冷却进气道安装结构