[发明专利]语音分离方法和装置有效
申请号: | 201410189386.5 | 申请日: | 2014-05-06 |
公开(公告)号: | CN105096961B | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 杨小洪;肖玮;梁山;刘文举 | 申请(专利权)人: | 华为技术有限公司;中国科学院自动化研究所 |
主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/02;G10L21/0208 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 分离 方法 装置 | ||
本发明实施例提供一种语音分离方法和装置,本实施例语音分离方法,包括:通过获得第一信号,根据第一信号确定初始理想二值掩蔽矩阵,根据初始理想二值掩蔽矩阵,对第一信号进行谐波补偿,得到谐波补偿后的分离语音信号,根据谐波补偿后的分离语音信号,对第一信号和第二信号进行滤波,得到目标分离语音信号,从而减少目标分离语音信号中能量空洞的产生,抑制了目标分离语音信号的扭曲。
技术领域
本发明实施例涉及信号处理技术领域,尤其涉及一种语音分离方法和装置。
背景技术
语音信号处理作为一个近年来引人注目的研究领域,至今已经在大词汇量连续语音识别、语音合成、语音通信等方面取得了一系列令人瞩目的成果。然而,现有的语音信号处理技术不少都是在纯净语音或带弱噪声的语音环境下研发的,在比较嘈杂的环境中并不总是能获得令人满意的效果,这在一定程度上限制了部分语音相关产品在实际生活中的应用。因此,如何抑制或者消除背景噪音,从而分离出目标语音信号已经成为语音信号处理领域中一个重要的研究方向。
计算听觉场景分析主要是基于听觉生理学和心理学领域的研究,采用声学掩蔽策略进行语音分离,使得分离语音更符合人耳的感知特性。现有技术中,通常采用基于阈值的理想二值掩蔽(Ideal Binary Mask,简称IBM)矩阵进行计算听觉场景分析,IBM矩阵是一个维度与时频谱图相同的0-1矩阵,其中1对应语音主导时频单元,0对应噪音主导时频单元。在目标语音合成阶段,语音主导的时频单元能量全部被保留,噪音主导时频单元能量会全部被拒绝。然而由于基于阈值的IBM矩阵的错误估计会造成部分语音主导的时频单元被错误地拒绝,部分噪声主导的时频单元被错误地保留,从而导致在分离后的语音信号中产生许多语音能量的空洞,从而在很大程度上扭曲了原语音信号。
发明内容
本发明实施例提供一种语音分离方法和装置,采用计算听觉场景分析和理想浮值掩蔽策略获得分离语音信号,从而减少分离语音信号中能量空洞的产生,抑制了分离语音信号的扭曲。
第一方面,本发明实施例提供一种语音分离方法,包括:
获得第一信号,所述第一信号包括语音信号和噪音信号;
根据所述第一信号确定初始理想二值掩蔽矩阵,所述初始理想二值掩蔽矩阵用于区分所述第一信号包括的语音信号和噪音信号;
根据所述初始理想二值掩蔽矩阵,对所述第一信号进行谐波补偿,得到谐波补偿后的分离语音信号;
根据所述谐波补偿后的分离语音信号,对所述第一信号和第二信号进行滤波,得到目标分离语音信号。
在第一方面的第一种可能的实现方式中,所述根据所述第一信号确定初始理想二值掩蔽矩阵,包括:
计算所述噪音信号的功率谱的平均值;
根据所述噪音信号的功率谱的平均值,确定构成所述初始理想二值掩蔽矩阵的所有时频单元的值;
根据构成所述初始理想二值掩蔽矩阵的所有时频单元的值,确定所述初始理想二值掩蔽矩阵。
根据第一方面的第一种可能的实现方式,在第二种可能的实现方式中,所述计算所述噪音信号的功率谱的平均值,包括:
根据所述第一信号中用于估计噪音的帧数目和对所述第一信号进行傅里叶变换之后第t帧、第k频段的频域信号的功率谱密度,计算所述噪音信号的功率谱的平均值,t是大于或等于1的整数,k是大于或等于1的整数。
根据第一方面、第一方面的第一种至第二种可能的实现方式中的任意一种,在第三种可能的实现方式中,所述根据所述初始理想二值掩蔽矩阵,对所述第一信号进行谐波补偿,得到谐波补偿后的分离语音信号,包括:
对所述初始理想二值掩蔽矩阵进行更新,得到更新后的二值掩蔽矩阵,所述更新后的二值掩蔽矩阵用于净化所述目标分离语音信号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司;中国科学院自动化研究所,未经华为技术有限公司;中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410189386.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:磁盘装置及数据刷新的处理方法
- 下一篇:音频编码方法及相关装置