[发明专利]频响校正方法及相关产品有效
申请号: | 202111510542.X | 申请日: | 2021-12-10 |
公开(公告)号: | CN114302301B | 公开(公告)日: | 2023-08-04 |
发明(设计)人: | 梁俊斌 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
主分类号: | H04R3/04 | 分类号: | H04R3/04 |
代理公司: | 深圳市联鼎知识产权代理有限公司 44232 | 代理人: | 叶虹 |
地址: | 518000 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 校正 方法 相关 产品 | ||
1.一种频响校正方法,其特征在于,包括:
对音频信号进行分帧加窗处理,得到多个待校正的音频数据帧;
对所述音频数据帧进行特征提取,得到所述音频数据帧的多维度声学特征;
将所述多维度声学特征输入预先训练的深度学习网络,以通过所述深度学习网络对所述多维度声学特征进行映射处理,得到所述音频数据帧在各个频点上的初级功率谱增益;
对多个音频数据帧在同一频点上的初级功率谱增益进行增益平滑处理,得到所述多个音频数据帧在所述同一频点上的校正功率谱增益;
根据所述校正功率谱增益对所述多个音频数据帧进行频响校正。
2.根据权利要求1所述的频响校正方法,其特征在于,对所述音频数据帧进行特征提取,包括:
对所述音频数据帧进行语音信号分析,得到至少一种用于表征所述音频数据帧携带语音信号的语音信号特征;
对所述音频数据帧进行频域变换,得到所述音频数据帧的频域特征;
对所述语音信号特征和所述频域特征进行特征融合,得到所述音频数据帧的多维度声学特征。
3.根据权利要求2所述的频响校正方法,其特征在于,所述语音信号特征包括基音周期或语音活跃检测值中的至少一种,所述频域特征包括各个频点上的频率谱。
4.根据权利要求2所述的频响校正方法,其特征在于,对所述音频数据帧进行语音信号分析,包括:
对所述音频数据帧进行基音检测,得到所述音频数据帧的基音周期;
对所述音频数据帧进行语音活跃检测,得到所述音频数据帧的语音活跃检测值。
5.根据权利要求2所述的频响校正方法,其特征在于,对所述音频数据帧进行频域变换,包括:
对所述音频数据帧进行傅里叶变换,得到所述音频数据帧在各个频点上的功率谱。
6.根据权利要求2所述的频响校正方法,其特征在于,所述频域特征包括所述音频数据帧在各个频点上的功率谱;对所述语音信号特征和所述频域特征进行特征融合,包括:
分别将所述语音信号特征与所述各个频点上的功率谱进行特征拼接处理,得到所述音频数据帧在各个频点上的多维度声学特征。
7.根据权利要求1至6中任意一项所述的频响校正方法,其特征在于,在对所述音频数据帧进行特征映射处理之前,所述方法还包括:
获取用于对所述音频数据帧进行特征映射处理的深度学习网络;
获取用于对所述深度学习网络进行训练的样本数据,所述样本数据包括原始音频信号和待校正音频信号,所述待校正音频信号是通过音频设备对所述原始音频信号进行输入或输出处理得到的信号;
对所述原始音频信号进行特征提取,得到所述原始音频信号的多维度声学特征;
将所述待校正音频信号与所述原始音频信号进行频域特征比较,得到所述待校正音频信号的期望功率谱增益;
以所述原始音频信号的多维度声学特征作为输入参数,并以所述待校正音频信号的期望功率谱增益作为输出目标,对所述深度学习网络进行迭代训练。
8.根据权利要求7所述的频响校正方法,其特征在于,将所述待校正音频信号与所述原始音频信号进行频域特征比较,包括:
分别对所述待校正音频信号和所述原始音频信号中的音频数据帧进行频域变换,得到所述音频数据帧的功率谱;
对所述音频数据帧的功率谱进行归一化处理,得到所述音频数据帧的归一化功率谱;
获取所述原始音频信号与所述待校正音频信号的归一化功率谱的功率谱比值;
根据所述功率谱比值与增益阈值的数值关系,确定所述待校正音频信号的期望功率谱增益。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111510542.X/1.html,转载请声明来源钻瓜专利网。