[发明专利]一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法有效

申请号：	201710992311.4	申请日：	2017-10-23
公开（公告）号：	CN107945811B	公开（公告）日：	2021-06-01
发明（设计）人：	曲天书;吴玺宏;黄庆博	申请（专利权）人：	北京大学
主分类号：	G10L19/02	分类号：	G10L19/02;G10L19/24;G10L21/038
代理公司：	北京君尚知识产权代理有限公司 11200	代理人：	司立彬
地址：	100871 北***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法。本发明的生成式对抗网络训练方法为：对音频信号进行瞬态信号检测；然后根据检测结果分别对其进行MDCT变换，将得到的频谱作为真数据；对频谱进行分带，并计算高低频频谱能量包络比，然后对该高低频频谱能量包络比进行量化、反量化；将分带得到的低频频谱输入生成网络GAN，生成高频频谱；利用反量化的高频能量包络修正生成的高频频谱，得到最终生成的高频频谱；将最终生成的高频频谱和分带得到的低频频谱合成为全带的生成频谱，将该全带的生成频谱作为假数据；将得到真数据、假数据作为判别网络D的输入，训练生成式对抗网络。本发明训练的网络易收敛。
搜索关键词：	一种面向频带扩展生成对抗网络训练方法音频编码解码
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种面向频带扩展的生成式对抗网络训练方法，其步骤包括：对音频信号进行瞬态信号检测；a)如果检测结果为稳态信号，则对其进行MDCT变换，将得到的频谱作为真数据；对得到的频谱进行分带，并根据得到的高频频谱、低频频谱计算高低频频谱能量包络比，然后对该高低频频谱能量包络比进行量化、反量化；将分带得到的低频频谱输入生成网络GAN，生成高频频谱；利用反量化的高频能量包络修正生成网络GAN生成的高频频谱，得到最终生成的高频频谱；将最终生成的高频频谱和分带得到的低频频谱合成为全带的生成频谱，将该全带的生成频谱作为假数据；将得到真数据、假数据作为判别网络D的输入，训练生成式对抗网络；b)如果检测结果为瞬态信号，则对其进行MDCT变换，将得到的频谱作为真数据；对得到的频谱进行分带，并根据得到的高频频谱、低频频谱计算高低频频谱能量包络比，然后对该高低频频谱能量包络比进行量化、反量化；将分带得到的低频频谱输入生成网络GAN，生成高频频谱；利用反量化的高频能量包络修正生成网络GAN生成的高频频谱，得到最终生成的高频频谱；将最终生成的高频频谱和分带得到的低频频谱合成为全带的生成频谱，将该全带的生成频谱作为假数据；将得到真数据、假数据作为判别网络D的输入，训练生成式对抗网络。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于北京大学，未经北京大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201710992311.4/，转载请声明来源钻瓜专利网。

上一篇：用于编码和解码HOA或多声道数据的方法和装置
下一篇：一种语音处理方法

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种面向频带扩展的生成式对抗网络训练方法及音频编码、解码方法有效

专利文献下载