[发明专利]语音信号的处理方法及装置有效
申请号: | 201911024108.3 | 申请日: | 2019-10-25 |
公开(公告)号: | CN110875049B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 鲍枫 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | G10L21/02 | 分类号: | G10L21/02 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 朱黎 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 信号 处理 方法 装置 | ||
本申请的实施例提供了一种语音信号的处理方法,包括:对语音信号进行语音预增强生成第一信号,所述语音信号包括含噪语音信号;对所述第一信号进行整流生成第二信号;根据所述第一信号和所述第二信号构建第三信号;基于所述语音信号、所述第一信号、所述第三信号确定目标增益因子;基于所述目标增益因子对所述语音信号进行处理,不仅实现了语音增强,而且减少了谐波的损失。
技术领域
本申请涉及信号处理领域,具体而言,涉及一种语音信号的处理方法及装置。
背景技术
语音增强是指当语音信号被各种各样的噪声干扰、甚至淹没后,从噪声背景中提取有用的原始语音,从而抑制、降低噪声干扰。简而言之,语音增强是指从含噪语音中提取尽可能纯净的原始语音。
现有技术中,主要通过谱减法、统计模型法、维纳滤波或者机器学习方法来进行语音增强。但是,无论是对平稳噪声具有较好的处理能力的传统方法(例如谱减法、统计模型法、维纳滤波)还是对非平稳噪声具有较好的处理能力的机器学习方法(例如DNN(DeepNeural Networks,深度神经网络)、RNN(Recurrent Neural Networks,循环神经网络)和CNN(Convolutional Neural Networks,卷积神经网络)),增强后的语音信号不可避免地会受到损伤,特别是原始语音中的谐波丢失或者能量削减。语音中的谐波直接影响听者的听觉感受,从而,语音中的谐波丢失或者能量下降降低了主观听觉质量。
由上可知,如何减少语音增强中谐波成分的丢失或能量削减是现有技术中亟待解决的问题。
发明内容
本申请的实施例提供了一种语音信号的处理方法及装置,进而至少在一定程度上可以减少语音增强中谐波成分的丢失或者能量削减,从而降低语音增强中对语音成分的损伤。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种语音信号的处理方法,包括:
对语音信号进行语音预增强生成第一信号,所述语音信号包括含噪语音信号;
对所述第一信号进行整流生成第二信号;
根据所述第一信号和所述第二信号构建第三信号;
基于所述语音信号、所述第一信号、所述第三信号确定目标增益因子;
基于所述目标增益因子对所述语音信号进行处理。
根据本申请实施例的一个方面,提供了一种语音信号的处理装置,包括:
预增强模块,用于对语音信号进行语音预增强生成第一信号,所述语音信号包括含噪语音信号;
整流模块,用于对所述第一信号进行整流生成第二信号;
信号构建模块,用于根据所述第一信号和所述第二信号构建第三信号;
确定模块,用于基于所述语音信号、所述第一信号、所述第三信号确定目标增益因子;
处理模块,用于基于所述目标增益因子对所述语音信号进行处理。
在本申请的一些实施例所提供的技术方案中,由于目标增益因子保留了第一信号相对于语音信号的增益,和第三信号相对于语音信号的增益,而第一信号中保留了语音信号中语音的基波分量,第三信号中凸出了语音中的谐波,从而,按照目标增益因子对语音信号进行处理即可以同时实现语音增强和减少谐波分量的损失,从而有效解决了现有技术中因语音增强处理所造成谐波分量损失的问题。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911024108.3/2.html,转载请声明来源钻瓜专利网。