[发明专利]语音信号处理方法、装置、设备及存储介质在审
| 申请号: | 202110226589.7 | 申请日: | 2021-03-01 |
| 公开(公告)号: | CN113707162A | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 梁俊斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L21/003 | 分类号: | G10L21/003;G10L21/057 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 信号 处理 方法 装置 设备 存储 介质 | ||
1.一种语音信号处理方法,其特征在于,所述方法包括:
将待处理语音信号由时域变换至频域,获取频域上各个频点的第一功率谱和相位信息;其中,所述待处理语音信号为初始语音信号或受损语音信号,所述初始语音信号是指未经过级联编码处理的语音信号,所述受损语音信号是指经过所述级联编码处理后得到的语音信号;
获取所述各个频点的频带增益值,基于所述各个频点的第一功率谱和频带增益值,确定所述各个频点的第二功率谱;
基于所述各个频点的相位信息和第二功率谱,生成符合语音播放条件的目标语音信号。
2.根据权利要求1所述的方法,其特征在于,响应于所述待处理语音信号为所述初始语音信号,所述基于所述各个频点的相位信息和第二功率谱,生成符合语音播放条件的目标语音信号,包括:
基于所述各个频点的相位信息和第二功率谱,生成中间语音信号;
对所述中间语音信号进行所述级联编码处理,得到所述目标语音信号。
3.根据权利要求1所述的方法,其特征在于,响应于所述待处理语音信号为所述受损语音信号,所述方法还包括:
在将所述待处理语音信号由时域变换至频域之前,对所述初始语音信号进行所述级联编码处理,得到所述受损语音信号。
4.根据权利要求1所述的方法,其特征在于,所述获取所述各个频点的频带增益值,基于所述各个频点的第一功率谱和频带增益值,确定所述各个频点的第二功率谱,包括:
将所述各个频点的第一功率谱输入目标神经网络,得到所述各个频点的频带增益值;其中,所述目标神经网络包括顺序连接的第一全连接层、门控循环单元层和第二全连接层;
将所述各个频点的第一功率谱与频带增益值之积,作为所述各个频点的第二功率谱。
5.根据权利要求4所述的方法,其特征在于,所述目标神经网络的训练过程包括:
获取语音样本在频域上各个频点的第三功率谱,所述第三功率谱是通过将所述语音样本由时域变换至频域得到的;
将所述语音样本对应的第三功率谱输入初始神经网络,得到所述第三功率谱对应的预测频带增益值;
基于所述语音样本的预测频带增益值和目标频带增益值,构建损失函数;
基于所述损失函数,不断调整所述初始神经网络的网络参数,直至满足预设条件,得到所述目标神经网络;
其中,所述目标频带增益值是基于所述第三功率谱和所述语音样本对应的第四功率谱得到的,所述第四功率谱是通过对所述语音样本进行所述级联编码处理后,再将所述语音样本由时域变换至频域得到的。
6.根据权利要求5所述的方法,其特征在于,所述目标频带增益值为所述第三功率谱与所述第四功率谱之比的平方根值。
7.根据权利要求4至6中任一项权利要求所述的方法,其特征在于,所述将所述各个频点的第一功率谱输入目标神经网络,得到所述各个频点的频带增益值,包括:
将所述各个频点的第一功率谱输入所述第一全连接层,经过所述第一全连接层对所述各个频点的第一功率谱进行特征提取,得到特征向量;
将所述特征向量输入所述门控循环单元层,经过所述门控循环单元层中的更新门和重置门,对所述特征向量之间的相关性和有效信息进行提取,得到输出向量;
将所述输出向量输入所述第二全连接层,经过所述第二全连接层将所述输出向量整合为所述各个频点的频带增益值。
8.根据权利要求1所述的方法,其特征在于,所述将待处理语音信号由时域变换至频域,获取频域上各个频点的第一功率谱和相位信息,包括:
对所述待处理语音信号依次进行分帧处理和加窗处理;
对经过分帧处理和加窗处理后的所述待处理语音信号进行快速傅里叶变换;基于得到的变换结果,确定频域上所述各个频点的第一功率谱和相位信息。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110226589.7/1.html,转载请声明来源钻瓜专利网。





