[发明专利]一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法有效
申请号: | 201710992311.4 | 申请日: | 2017-10-23 |
公开(公告)号: | CN107945811B | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 曲天书;吴玺宏;黄庆博 | 申请(专利权)人: | 北京大学 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/24;G10L21/038 |
代理公司: | 北京君尚知识产权代理有限公司 11200 | 代理人: | 司立彬 |
地址: | 100871 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法。本发明的生成式对抗网络训练方法为:对音频信号进行瞬态信号检测;然后根据检测结果分别对其进行MDCT变换,将得到的频谱作为真数据;对频谱进行分带,并计算高低频频谱能量包络比,然后对该高低频频谱能量包络比进行量化、反量化;将分带得到的低频频谱输入生成网络GAN,生成高频频谱;利用反量化的高频能量包络修正生成的高频频谱,得到最终生成的高频频谱;将最终生成的高频频谱和分带得到的低频频谱合成为全带的生成频谱,将该全带的生成频谱作为假数据;将得到真数据、假数据作为判别网络D的输入,训练生成式对抗网络。本发明训练的网络易收敛。 | ||
搜索关键词: | 一种 面向 频带 扩展 生成 对抗 网络 训练 方法 音频 编码 解码 | ||
【主权项】:
一种面向频带扩展的生成式对抗网络训练方法,其步骤包括:对音频信号进行瞬态信号检测;a)如果检测结果为稳态信号,则对其进行MDCT变换,将得到的频谱作为真数据;对得到的频谱进行分带,并根据得到的高频频谱、低频频谱计算高低频频谱能量包络比,然后对该高低频频谱能量包络比进行量化、反量化;将分带得到的低频频谱输入生成网络GAN,生成高频频谱;利用反量化的高频能量包络修正生成网络GAN生成的高频频谱,得到最终生成的高频频谱;将最终生成的高频频谱和分带得到的低频频谱合成为全带的生成频谱,将该全带的生成频谱作为假数据;将得到真数据、假数据作为判别网络D的输入,训练生成式对抗网络;b)如果检测结果为瞬态信号,则对其进行MDCT变换,将得到的频谱作为真数据;对得到的频谱进行分带,并根据得到的高频频谱、低频频谱计算高低频频谱能量包络比,然后对该高低频频谱能量包络比进行量化、反量化;将分带得到的低频频谱输入生成网络GAN,生成高频频谱;利用反量化的高频能量包络修正生成网络GAN生成的高频频谱,得到最终生成的高频频谱;将最终生成的高频频谱和分带得到的低频频谱合成为全带的生成频谱,将该全带的生成频谱作为假数据;将得到真数据、假数据作为判别网络D的输入,训练生成式对抗网络。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京大学,未经北京大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710992311.4/,转载请声明来源钻瓜专利网。
- 上一篇:用于编码和解码HOA或多声道数据的方法和装置
- 下一篇:一种语音处理方法