[发明专利]频带扩展方法及装置有效
申请号: | 201711321259.6 | 申请日: | 2017-12-12 |
公开(公告)号: | CN107993672B | 公开(公告)日: | 2020-07-03 |
发明(设计)人: | 王征韬 | 申请(专利权)人: | 腾讯音乐娱乐科技(深圳)有限公司 |
主分类号: | G10L21/038 | 分类号: | G10L21/038;G10L21/0388;G10L25/24 |
代理公司: | 深圳翼盛智成知识产权事务所(普通合伙) 44300 | 代理人: | 黄威 |
地址: | 518000 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 频带 扩展 方法 装置 | ||
1.一种频带扩展方法,其特征在于,包括:
从预设宽频带信号中进行采样,生成预设窄频带信号;
获取所述预设窄频带信号的低频频谱,并从获取的低频频谱中提取梅尔频率倒谱系数MFCC;将从所述预设窄频带信号的低频频谱中提取的MFCC输入第一预设网络,得到高频频谱包络,根据得到的高频频谱包络将所述预设窄频带信号的低频频谱扩展为高频频谱,将扩展得到的高频频谱进行频时变换,得到第一预设高频信号;将所述预设窄频带信号输入第二预设网络,得到第二预设高频信号;将所述第一预设高频信号和所述第二预设高频信号作为卷积神经网络的输入,将卷积神经网络输出的宽频带信号与对应的所述预设宽频带信号的均方误差作为损失函数,进行网络训练,得到第三预设网络;
将待处理窄频带信号的梅尔频率倒谱系数MFCC输入所述第一预设网络,利用所述第一预设网络进行频域包络预测,得到高频频谱包络;
根据预测得到的高频频谱包络将所述待处理窄频带信号的低频频谱扩展为高频频谱;
将扩展得到的高频频谱进行频时变换,得到第一目标高频信号;
将所述待处理窄频带信号输入所述第二预设网络,利用所述第二预设网络进行时域插值,得到第二目标高频信号;
将所述第一目标高频信号和所述第二目标高频信号输入所述第三预设网络,利用所述第三预设网络将所述第一目标高频信号与所述第二目标高频信号进行融合,得到目标宽频带信号。
2.根据权利要求1所述的频带扩展方法,其特征在于,在将待处理窄频带信号的MFCC输入所述第一预设网络之前,还包括:
将所述预设宽频带信号和所述预设窄频带信号作为训练数据,进行网络训练,得到所述第一预设网络和所述第二预设网络。
3.根据权利要求2所述的频带扩展方法,其特征在于,将所述预设宽频带信号和所述预设窄频带信号作为训练数据,进行网络训练,得到所述第一预设网络,包括:
将从所述预设窄频带信号的低频频谱中提取的MFCC作为卷积神经网络的输入,将卷积神经网络输出的高频频谱包络与对应的所述预设宽频带信号的高频频谱包络的均方误差作为损失函数,进行网络训练,得到所述第一预设网络。
4.根据权利要求3所述的频带扩展方法,其特征在于,将所述预设宽频带信号和所述预设窄频带信号作为训练数据,进行网络训练,得到所述第二预设网络,包括:
将所述预设窄频带信号作为卷积神经网络的输入,将卷积神经网络输出的宽频带信号与对应的所述预设宽频带信号的均方误差作为损失函数,进行网络训练,得到所述第二预设网络。
5.根据权利要求1所述的频带扩展方法,其特征在于,在从预设宽频带信号中进行采样,生成预设窄频带信号之后,还包括:
对所述预设窄频带信号进行分帧,每帧长度为2n,n为正整数。
6.根据权利要求1至5任意一项所述的频带扩展方法,其特征在于,所述方法还包括:
滤除所述目标宽频带信号中的噪声。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯音乐娱乐科技(深圳)有限公司,未经腾讯音乐娱乐科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711321259.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:声音处理方法、装置和电子设备
- 下一篇:一种情绪控制方法及装置