[发明专利]基于稀疏编码和理想二进制掩膜相结合的语音增强方法有效

申请号：	201410476932.3	申请日：	2014-09-17
公开（公告）号：	CN104240717B	公开（公告）日：	2017-04-26
发明（设计）人：	汤一彬;谈雅文;李旭斐;蒋爱民;徐宁;殷澄	申请（专利权）人：	河海大学常州校区
主分类号：	G10L21/0208	分类号：	G10L21/0208
代理公司：	南京纵横知识产权代理有限公司32224	代理人：	董建林
地址：	213022 ***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于稀疏编码和理想二进制掩膜相结合的语音增强方法，其是针对于传统的理想二进制掩膜算法存在噪声残留和语音成分丢失的缺陷进行改进的算法。本发明首先利用短时傅里叶变换将时域语音信号转换到频域信号,在频域中,采用理想二进制掩膜方法对语音信号进行初步降噪处理；然后采用稀疏编码理论对初步降噪后的语音信号做进一步降噪处理，同时从被认为是干扰信号中提取有效的语音成分，从而达到语音增强的效果。与相关技术相比，本发明具有去噪性能好，语音的可理解性高等优点。
搜索关键词：	基于稀疏编码理想二进制相结合语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于稀疏编码和理想二进制掩膜相结合的语音增强方法，其特征在于:首先利用理想的二进制掩膜算法对信号功率谱进行初步降噪处理；其次通过稀疏编码对处理后的信号做进一步处理，从而实现语音增强的效果，具体包含以下步骤：(1)将时域信号转换为频域信号；(2)采用理想二进制掩膜算法对语音信号功率谱进行初步降噪处理，包括如下步骤：(b1)根据语音信号受污染的程度，选定一个阈值；(b2)计算出每一个时频点的信噪比，若该时频点的信噪比大于选定的阈值，则掩膜中相应位置的元素为1；反之，该元素为0；(b3)将时频信号和掩膜进行点乘，即可得到经过理想二进制掩膜算法初步处理后的语音信号Sr；(b4)将时频信号和掩膜的逻辑逆矩阵进行点乘，即可得到在IBM算法中被认为是噪声的干扰信号Vr；(3)利用稀疏编码理论对初步处理后的信号作进一步降噪处理，同时从被认为是干扰信号中提取有效的语音成分，工作过程包括如下步骤：(c1)根据稀疏理论，将步骤(b3)中初步处理后的语音信号Sr作训练样本，采用K‑SVD算法训练出语音信号字典Ds以及相对应的稀疏系数Xe；(c2)根据稀疏理论，将步骤(b4)中的干扰信号Vr作训练样本，同样采用K‑SVD算法训练出干扰信号字典Dv以及采用正交匹配算法计算出该字典相应的稀疏系数Xv；(c3)由于步骤(c2)中的训练样本Vr主要是干扰信号，所以用步骤(c2)训练出的字典Dv表示步骤(2)中语音信号Sr；(c4)依据原子表示语音信号的比例，将字典Dv中的原子进行排序；(c5)将前5％的原子组成一个新的字典D′s，该字典组要用于提取干扰信号Vr中包含的语音信号；字典Dv中其余原子组成字典D'v；(c6)字典D′s与字典D'v进行正交，正交后的字典标记为D″s；(4)采用语音信号的初始相位信息恢复出频域信号，进而对其进行反傅里叶变换，得到增强后的目标语音信号，工作过程包括如下步骤：(d1)按照字典D″s、D'v的原子位置，将稀疏系数Xv中相应的系数组成新的稀疏系数并标记为Xe和Xv，进而进行语音信号重构；(d2)采用步骤(2)获取的语音信号相位作为目标语音信号相位，进而合成出语音信号；(d3)将(d2)中的语音信号作反离散傅里叶变换(IFFT)，将分帧的信号合成目标语音信号。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于河海大学常州校区，未经河海大学常州校区许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201410476932.3/，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]基于稀疏编码和理想二进制掩膜相结合的语音增强方法有效

专利文献下载