[发明专利]语音增强的方法和装置在审

申请号：	201510159358.3	申请日：	2015-04-07
公开（公告）号：	CN104778951A	公开（公告）日：	2015-07-15
发明（设计）人：	周璇;夏丙寅;苗磊	申请（专利权）人：	华为技术有限公司
主分类号：	G10L21/02	分类号：	G10L21/02
代理公司：	北京龙双利达知识产权代理有限公司 11329	代理人：	毛威;肖鹂
地址：	518129 广东***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音增强方法装置
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

技术领域

本发明实施例涉及语音处理领域，并且更具体地，涉及一种语音增强的方法和装置。

背景技术

随着通讯技术和网络技术的飞速发展，语音通信已远远超越了传统的以固定电话为主要形式的范畴，在手机通信、电视/电话会议、车载免提通信、IP电话等诸多领域中被广泛应用。在语音通信的应用中，要保证语音信号的清晰和高质量，消除语音信号中由这些新的语音通信方式而产生的各种噪声，是具有挑战性的问题。

目前，语音通信中语音增强的最大困难在于噪声环境的未知性(或统计特性的不确定性)。现有技术中应用并且研究最广泛的是基于隐马尔科夫模型(Hidden Markov Model，HMM)的语音增强方法。HMM语音增强方法对语音增强的效果较好。但HMM语音增强方法过于依赖外界先验输入，在噪声类型未知或者噪声切换的情况下增强效果较差。

为了克服上述缺点，有研究提出了根据采集的噪声样本训练噪声模型，多个噪声样本和噪声模型形成噪声样本和噪声模型映射关系列表。然后确定与输入的含噪语音信号中的噪声匹配的噪声样本，再根据噪声样本和噪声模型映射关系列表，确定匹配的噪声模型。根据匹配得到的噪声模型，基于HMM语音增强方法进行语音增强，能够在一定程度上提升算法的鲁棒性。

但是，噪声样本和噪声模型映射关系列表中包括的噪声样本和噪声模型的个数有限，当输入语音信号中的噪声在映射关系列表中不存在较为接近的噪声样本时，根据噪声样本和噪声模型映射关系列表确定的噪声模型的增强效果差，因此该方法的普适性还有待加强。此外，该方法对每种噪声都要进行单独训练和建立模型，对存储空间的需求较大，限制了其实际的可用性。

发明内容

本发明实施例提供一种语音增强的方法和装置，能够提高语音增强的效果。

第一方面，提供了一种语音增强的方法，包括：

获取语音信号的静音段中噪声的特征量；

根据所述静音段中噪声的特征量，从预设的多个噪声类中确定与所述静音段中噪声匹配的噪声类，所述多个噪声类是根据多个噪声样本的特征量对所述多个噪声样本进行聚类后得到的；

根据所述与所述静音段中噪声匹配的噪声类，以及噪声类和噪声模型的映射关系，确定与所述静音段中噪声匹配的噪声类对应的噪声模型；

根据所述与所述静音段中噪声匹配的噪声类对应的噪声模型，对所述语音信号进行语音增强。

结合第一方面，在第一方面的第一种可能的实现方式中，所述特征量包括噪声平均谱熵值、噪声归一化临界带能量比重和噪声平均过零率中的至少一种。

结合第一方面或第一方面的第一种可能的实现方式，在第一方面的第二种可能的实现方式中，所述多个噪声样本包括n个噪声样本，所述方法还包括：

获取所述n个噪声样本，计算所述n个噪声样本各自的特征量；

根据所述n个噪声样本各自的特征量，将所述n个噪声样本聚类为m个噪声类；

对所述m个噪声类进行训练，以获得所述m个噪声类对应的噪声模型；