[发明专利]一种语音处理方法、装置及设备在审

申请号：	201911320774.1	申请日：	2019-12-19
公开（公告）号：	CN113012711A	公开（公告）日：	2021-06-22
发明（设计）人：	潘昕;何礼	申请（专利权）人：	中国移动通信有限公司研究院;中国移动通信集团有限公司
主分类号：	G10L21/034	分类号：	G10L21/034;G10L21/0208;G10L21/0232
代理公司：	北京银龙知识产权代理有限公司 11243	代理人：	许静;安利霞
地址：	100053 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种语音处理方法装置设备
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种语音处理方法，其特征在于，包括：

获取语音通话中的第一语音信号，所述第一语音信号为带噪语音信号；

根据初始过减因子以及初始增益补偿因子，对所述第一语音信号进行初步降噪，得到第二语音信号；

根据所述第二语音信号，计算听觉遮掩阈值；

根据所述听觉遮掩阈值，调整所述初始过减因子以及所述初始增益补偿因子，获得调整后过减因子以及调整后增益补偿因子；

根据调整后过减因子以及调整后增益补偿因子，对所述第二语音信号进行降噪，得到第三语音信号。

2.根据权利要求1所述的方法，其特征在于，所述根据初始过减因子以及初始增益补偿因子，对所述原始语音信号进行初步降噪，得到第二语音信号，包括：

通过傅里叶变换，获取所述第一语音信号的第一功率谱；

根据所述第一功率谱进行噪声估计，得到噪声估计值；

基于所述噪声估计、初始过减因子以及初始增益补偿因子，得到第二语音信号的第二功率谱。

3.根据权利要求2所述的方法，其特征在于，所述基于所述噪声估计、初始过减因子以及初始增益补偿因子，得到第二语音信号的第二功率谱，包括：

通过公式计算第二语音信号的第二功率谱其中，|Y(m,k)|²为所述第一功率谱，为所述噪声估计值，α₀为所述初始过减因子，β₀为所述初始增益补偿因子；m为当前帧的序列号，k为当前频带的序列号。

4.根据权利要求2所述的方法，其特征在于，所述根据所述第一功率谱进行噪声估计，得到噪声估计值，包括：

根据预设时间窗，获取所述第一功率谱中的最小功率值；

根据所述最小功率值进行偏差补偿，得到所述噪声估计值。

5.根据权利要求3所述的方法，其特征在于，所述根据所述第二语音信号，计算听觉遮掩阈值，包括：

按照临界频带划分的多个子带，计算所述第二语音信号在各个子带内的能量；

通过公式T(m,k)＝max(T'(m,k),T_a(m,k))，计算听觉遮掩阈值T(m,k)；其中，T_a(m,k)为绝对听觉阈值，T'(m,k)为初始掩蔽阈值T₀(m,k)扩展到各个频谱上值，且O_ij为第i帧的第j个子带的偏移量，C_rt为扩展功率谱，t为被掩蔽的临界带宽指数，t'为信号的临界带宽指数，B_r为第r个子带的能量。

6.根据权利要求5所述的方法，其特征在于，所述临界频带为梅尔频带。

7.根据权利要求3所述的方法，其特征在于，所述根据所述听觉遮掩阈值，调整所述初始过减因子以及所述初始增益补偿因子，获得调整后过减因子以及调整后增益补偿因子，包括：

根据公式以及确定调整后过减因子α_m以及调整后增益补偿因子β_m；其中，N_min(m,k)为噪声估计的最小值，N_max(m,k)为噪声估计的最大值，T_min(m,k)为听觉掩蔽阈值的最小值，T_max(m,k)为听觉掩蔽阈值的最大值，α_min为过减因子最小值，α_max为过减因子最大值，β_min为增益补偿因子最小值，β_max为增益补偿因子最大值，α_m-1为调整过程中的前一过减因子，β_m-1为调整过程中的前一增益补偿因子。

8.根据权利要求7所述的方法，其特征在于，所述根据调整后过减因子以及调整后增益补偿因子，对所述第二语音信号进行降噪，得到第三语音信号，包括：

通过公式计算第三语音信号的第三功率谱

通过对所述第三功率谱的逆傅里叶变换，得到第三语音信息。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团有限公司，未经中国移动通信有限公司研究院;中国移动通信集团有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201911320774.1/1.html，转载请声明来源钻瓜专利网。

上一篇：网络参数更新方法、装置及存储介质、电子设备
下一篇：一种薄荷油微胶囊的包裹方法及应用

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种语音处理方法、装置及设备在审

专利文献下载