[发明专利]语音信号处理方法、装置、设备及存储介质在审
| 申请号: | 202110226589.7 | 申请日: | 2021-03-01 |
| 公开(公告)号: | CN113707162A | 公开(公告)日: | 2021-11-26 |
| 发明(设计)人: | 梁俊斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G10L21/003 | 分类号: | G10L21/003;G10L21/057 |
| 代理公司: | 北京三高永信知识产权代理有限责任公司 11138 | 代理人: | 祝亚男 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 信号 处理 方法 装置 设备 存储 介质 | ||
本申请提供了一种语音信号处理方法、装置、设备及存储介质,属于人工智能技术领域。对于待处理语音信号,首先获取这类语音信号在频域上各个频点的第一功率谱和相位信息,然后通过获取各个频点对应的频带增益值,实现对第一功率谱进行增强,得到各个频点的第二功率谱,进而实现根据各个频点的第二功率谱和相位信息来生成符合语音播放条件的目标语音信号。由于该种处理方式有针对性地对各个频点的功率谱均进行了增强,使得语音信号的增强效果更加稳定,有效提升了语音质量,进而增强了语音可懂度;而且,无论待处理语音信号先前是否经过级联编码处理,均可以采用该种处理方式对这类语音信号进行增强,适用范围广。
技术领域
本申请涉及人工智能技术领域,特别涉及一种语音信号处理方法、装置、设备及存储介质。
背景技术
随着移动通讯技术和互联网技术的快速发展,各类具备通信功能的应用程序应运而生,用户与用户之间可以通过终端安装的这类应用程序进行语音通话。为了使位于不同网络的终端之间能够语音对接,通话链路中会出现多次编解码,也即是级联编码。然而,级联编码的次数越多,语音信号的损伤越严重,导致语音双方听不清对方的说话内容,即语音可懂度下降。
相关技术解决上述问题的方案通常是:对经过级联编码后的语音信号进行共振峰搜索,然后从搜索到的共振峰中提取出受损语音信号的共振峰,并对这类共振峰以相同的增强幅值进行提升,以实现对受损语音信号进行补偿。
然而,语音信号在经过级联编码后,处于不同频率的语音信号的受损程度往往是不一致的,而上述方案采用的是相同的增强幅值,也即不同受损程度的语音信号得到的补偿是一致的,这会使得受损语音信号的增强效果不稳定,无法有效地提升语音质量。
发明内容
本申请实施例提供了一种语音信号处理方法、装置、设备及存储介质,有效提升了语音质量,进而增强了语音可懂度。该技术方案如下:
一方面,提供了一种语音信号处理方法,该方法包括:
将待处理语音信号由时域变换至频域,获取频域上各个频点的第一功率谱和相位信息;其中,该待处理语音信号为初始语音信号或受损语音信号,该初始语音信号是指未经过级联编码处理的语音信号,该受损语音信号是指经过该级联编码处理后得到的语音信号;
获取该各个频点的频带增益值,基于该各个频点的第一功率谱和频带增益值,确定该各个频点的第二功率谱;
基于该各个频点的相位信息和第二功率谱,生成符合语音播放条件的目标语音信号。
另一方面,提供了一种语音信号处理装置,该装置包括:
获取模块,用于将待处理语音信号由时域变换至频域,获取频域上各个频点的第一功率谱和相位信息;其中,该待处理语音信号为初始语音信号或受损语音信号,该初始语音信号是指未经过级联编码处理的语音信号,该受损语音信号是指经过该级联编码处理后得到的语音信号;
确定模块,用于获取该各个频点的频带增益值,基于该各个频点的第一功率谱和频带增益值,确定该各个频点的第二功率谱;
生成模块,用于基于该各个频点的相位信息和第二功率谱,生成符合语音播放条件的目标语音信号。
在一种可选地实现方式中,响应于该待处理语音信号为该受损语音信号,该装置还包括:
处理模块,用于在将该待处理语音信号由时域变换至频域之前,对该初始语音信号进行该级联编码处理,得到该受损语音信号。
在一种可选地实现方式中,该装置还包括训练模块,该训练模块用于:
获取语音样本在频域上各个频点的第三功率谱,该第三功率谱是通过将该语音样本由时域变换至频域得到的;
将该语音样本对应的第三功率谱输入初始神经网络,得到该第三功率谱对应的预测频带增益值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110226589.7/2.html,转载请声明来源钻瓜专利网。





