[发明专利]一种音频中节拍器噪声抑制方法及系统在审
申请号: | 202111034565.8 | 申请日: | 2021-09-03 |
公开(公告)号: | CN113823305A | 公开(公告)日: | 2021-12-21 |
发明(设计)人: | 魏新元;段志尧;何欣燕 | 申请(专利权)人: | 深圳市芒果未来科技有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0264;G10L21/028 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 518102 广东省深圳市宝安区西乡街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 音频 节拍器 噪声 抑制 方法 系统 | ||
1.一种音频中节拍器噪声抑制方法,其特征在于,包括以下步骤:
S1:获取节拍器空响音频,对获取的所述音频进行短时傅里叶变换和时频谱矩阵处理得到节拍器词典和节拍器词典的激活权重;
S2:获取待处理的音频信号并进行短时傅里叶变换,得到第t帧信号的幅度谱和相位谱并对幅度谱进行归一化;
S3:对待处理的音频信号进行声源分离,利用得到的幅度谱和相位谱分别重建得到节拍器时域信号和乐器音频时域信号。
2.根据权利要求1所述一种音频中节拍器噪声抑制方法,其特征在于,步骤S1的具体过程为:
S101,获取节拍器空响音频,将节拍器的空响音频分帧加窗处理并进行短时傅里叶变换;
S102,将傅里叶变换得到的信号序列归一化处理得到时频谱矩阵;
S103,对时频谱矩阵利用EM算法进行非负矩阵分解得到节拍器词典wm和节拍器词典的激活权重hm。
3.根据权利要求2所述的一种音频中节拍器噪声抑制方法,其特征在于,节拍器信号的幅度谱为:
M=wm*hm
乐器信号的幅度谱为:
I=wI*hI
其中,wm表示节拍器词典,hm表示节拍器词典的激活权重,wI表示乐器词典,hI表示乐器词典的激活权重。
4.根据权利要求1所述一种音频中节拍器噪声抑制方法,其特征在于,所述待处理的音频信号为实时信号时其处理过程为:
a1:获取待处理的实时信号并进行短时傅里叶变换,得到第t帧信号的幅度谱和相位谱,归一化当前帧的幅度谱,利用幅度谱判断第t帧信号是否为静音帧,若为静音帧则对第t帧信号重建,若为非静音帧则转至步骤a2;
a2:判断非静音帧包括节拍器还是仅包括乐器帧,若包括节拍器则对该非静音帧进行节拍器分离;若仅包括乐器帧则将该帧存入乐器帧缓冲器中同时学习乐器词典,并将存入的乐器帧替代最老的乐器帧,同时重建该非静音帧的时域信号;
a3:将包括节拍器的非静音帧进行节拍器和乐器声源分离,分别得到声源分离后的乐器音频的幅度谱;
a4:将步骤a3得到的乐器音频的d幅度谱进行归一化并结合步骤a1中得到的相位谱进行逆傅里叶变换,重建得到步骤a3所述的非静音帧的乐器音频的时域信号。
5.根据权利要求4所述的一种音频中节拍器噪声抑制方法,其特征在于,步骤a1的具体过程为:
a101,获取待处理的实时信号进行分帧加窗后并进行短时傅里叶变换,得到第t帧信号的幅度谱和相位谱;
a102,对幅度谱进行归一化,计算第t帧信号的能量;
a103,若第t帧信号的能量小于预设的阈值则判断第t帧信号为静音帧,并利用该帧的相位谱和逆傅里叶变换进行信号重建;
a104,若第t帧信号的能量大于预设的阈值,则判断第t帧信号为非静音帧并转至步骤a2进行非静音帧处理。
6.根据权利要求1所述的一种音频中节拍器噪声抑制方法,其特征在于,步骤a2的具体过程为:
a201,利用节拍器字典重建非静音帧的幅度谱记为计算与真实幅度谱之间的散度;
a202,若散度小于预设的散度阈值则该非静音帧包含有节拍器并转至步骤a3进行节拍器和声源分离;
a203,若散度大于预设的散度阈值则该非静音帧仅包含乐器帧将该帧存入乐器帧缓冲器中用于学习乐器词典,并将存入的乐器帧替代最老的乐器帧,同时利用该帧的真实幅度谱和相位谱重建该非静音帧的时域信号。
7.根据权利要求4所述的一种音频中节拍器噪声抑制方法,其特征在于,所述乐器帧缓冲器的长度范围为0.5-2秒。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市芒果未来科技有限公司,未经深圳市芒果未来科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111034565.8/1.html,转载请声明来源钻瓜专利网。