[发明专利]一种语音处理方法、装置及设备在审
申请号: | 201911320774.1 | 申请日: | 2019-12-19 |
公开(公告)号: | CN113012711A | 公开(公告)日: | 2021-06-22 |
发明(设计)人: | 潘昕;何礼 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团有限公司 |
主分类号: | G10L21/034 | 分类号: | G10L21/034;G10L21/0208;G10L21/0232 |
代理公司: | 北京银龙知识产权代理有限公司 11243 | 代理人: | 许静;安利霞 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 处理 方法 装置 设备 | ||
1.一种语音处理方法,其特征在于,包括:
获取语音通话中的第一语音信号,所述第一语音信号为带噪语音信号;
根据初始过减因子以及初始增益补偿因子,对所述第一语音信号进行初步降噪,得到第二语音信号;
根据所述第二语音信号,计算听觉遮掩阈值;
根据所述听觉遮掩阈值,调整所述初始过减因子以及所述初始增益补偿因子,获得调整后过减因子以及调整后增益补偿因子;
根据调整后过减因子以及调整后增益补偿因子,对所述第二语音信号进行降噪,得到第三语音信号。
2.根据权利要求1所述的方法,其特征在于,所述根据初始过减因子以及初始增益补偿因子,对所述原始语音信号进行初步降噪,得到第二语音信号,包括:
通过傅里叶变换,获取所述第一语音信号的第一功率谱;
根据所述第一功率谱进行噪声估计,得到噪声估计值;
基于所述噪声估计、初始过减因子以及初始增益补偿因子,得到第二语音信号的第二功率谱。
3.根据权利要求2所述的方法,其特征在于,所述基于所述噪声估计、初始过减因子以及初始增益补偿因子,得到第二语音信号的第二功率谱,包括:
通过公式计算第二语音信号的第二功率谱其中,|Y(m,k)|2为所述第一功率谱,为所述噪声估计值,α0为所述初始过减因子,β0为所述初始增益补偿因子;m为当前帧的序列号,k为当前频带的序列号。
4.根据权利要求2所述的方法,其特征在于,所述根据所述第一功率谱进行噪声估计,得到噪声估计值,包括:
根据预设时间窗,获取所述第一功率谱中的最小功率值;
根据所述最小功率值进行偏差补偿,得到所述噪声估计值。
5.根据权利要求3所述的方法,其特征在于,所述根据所述第二语音信号,计算听觉遮掩阈值,包括:
按照临界频带划分的多个子带,计算所述第二语音信号在各个子带内的能量;
通过公式T(m,k)=max(T'(m,k),Ta(m,k)),计算听觉遮掩阈值T(m,k);其中,Ta(m,k)为绝对听觉阈值,T'(m,k)为初始掩蔽阈值T0(m,k)扩展到各个频谱上值,且Oij为第i帧的第j个子带的偏移量,Crt为扩展功率谱,t为被掩蔽的临界带宽指数,t'为信号的临界带宽指数,Br为第r个子带的能量。
6.根据权利要求5所述的方法,其特征在于,所述临界频带为梅尔频带。
7.根据权利要求3所述的方法,其特征在于,所述根据所述听觉遮掩阈值,调整所述初始过减因子以及所述初始增益补偿因子,获得调整后过减因子以及调整后增益补偿因子,包括:
根据公式以及确定调整后过减因子αm以及调整后增益补偿因子βm;其中,Nmin(m,k)为噪声估计的最小值,Nmax(m,k)为噪声估计的最大值,Tmin(m,k)为听觉掩蔽阈值的最小值,Tmax(m,k)为听觉掩蔽阈值的最大值,αmin为过减因子最小值,αmax为过减因子最大值,βmin为增益补偿因子最小值,βmax为增益补偿因子最大值,αm-1为调整过程中的前一过减因子,βm-1为调整过程中的前一增益补偿因子。
8.根据权利要求7所述的方法,其特征在于,所述根据调整后过减因子以及调整后增益补偿因子,对所述第二语音信号进行降噪,得到第三语音信号,包括:
通过公式计算第三语音信号的第三功率谱
通过对所述第三功率谱的逆傅里叶变换,得到第三语音信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司,未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911320774.1/1.html,转载请声明来源钻瓜专利网。