[发明专利]波形生成方法以及相关模型的训练方法和相关设备、装置有效
申请号: | 202110056064.3 | 申请日: | 2021-01-15 |
公开(公告)号: | CN112820267B | 公开(公告)日: | 2022-10-04 |
发明(设计)人: | 伍宏传;胡亚军;江源 | 申请(专利权)人: | 科大讯飞股份有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L25/03;G10L25/18;G10L25/27 |
代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 李申 |
地址: | 230088 安徽省*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 波形 生成 方法 以及 相关 模型 训练 设备 装置 | ||
1.一种波形生成模型的训练方法,其特征在于,包括:
获取样本音频波形和所述样本音频波形的样本声学参数;其中,所述样本音频波形是在现实场景中采集得到的;
利用所述样本声学参数预测得到样本初始幅度谱,并基于样本初始相位谱和所述样本初始幅度谱,得到样本初始波形;
将所述样本初始波形输入波形生成模型,得到样本生成波形;
基于所述样本生成波形和所述样本音频波形之间的差异,调整所述波形生成模型的网络参数;
其中,所述波形生成模型包括幅度预测网络;所述利用所述样本声学参数预测得到样本初始幅度谱,包括:
利用所述幅度预测网络处理所述样本声学参数,得到所述样本初始幅度谱。
2.根据权利要求1所述的方法,其特征在于,所述波形生成模型包括多个顺序连接的波形生成网络,所述多个顺序连接的波形生成网络依次作为当前生成网络;所述将所述样本初始波形输入波形生成模型,得到样本生成波形,包括:
将首个所述波形生成网络作为所述当前生成网络,并将所述样本初始波形输入所述当前生成网络,得到所述样本生成波形;
在所述样本生成波形的样本生成幅度谱中,融合所述样本初始幅度谱,得到样本融合波形;
将最新所述当前生成网络的下一个所述波形生成网络,作为新的当前生成网络,并将最新所述样本融合波形输入所述新的当前生成网络,得到新的样本生成波形。
3.根据权利要求2所述的方法,其特征在于,所述在所述样本生成波形的样本生成幅度谱中融合所述样本初始幅度谱,得到样本融合波形,包括:
提取所述样本生成波形的样本生成幅度谱和样本生成相位谱;
将所述样本初始幅度谱和所述样本生成幅度谱进行融合,得到样本融合幅度谱;
基于所述样本生成相位谱和所述样本融合幅度谱,得到所述样本融合波形。
4.根据权利要求3所述的方法,其特征在于,所述将所述样本初始幅度谱和所述样本生成幅度谱进行融合,得到样本融合幅度谱,包括:
分别利用第一权值、第二权值对所述样本初始幅度谱、所述样本生成幅度谱进行加权处理,得到所述样本融合幅度谱;
其中,所述第一权值和所述第二权值为负相关关系。
5.根据权利要求2所述的方法,其特征在于,在所述将最新所述样本融合波形输入所述新的当前生成网络,得到新的样本生成波形之后,所述方法还包括:
在最新所述当前生成网络并非所述波形生成模型中最后一个所述波形生成网络的情况下,在最新所述样本生成波形的样本生成幅度谱中,重新执行所述融合所述样本初始幅度谱,得到样本融合波形的步骤以及后续步骤。
6.根据权利要求2所述的方法,其特征在于,所述波形生成网络包括若干顺序连接的第一卷积层和第一全连接层,且所述第一卷积层包括若干一维卷积核。
7.根据权利要求1所述的方法,其特征在于,所述基于所述样本生成波形和所述样本音频波形之间的差异,调整所述波形生成模型的网络参数,包括:
将所述样本生成波形输入波形鉴别模型,得到所述样本生成波形被鉴别为所述样本音频波形的第一概率值;以及,
将所述样本音频波形输入所述波形鉴别模型,得到所述样本音频波形被鉴别为所述样本音频波形的第二概率值;
基于所述第一概率值,得到所述波形生成模型的第一损失值,并基于所述第一概率值和所述第二概率值,得到所述波形鉴别模型的第二损失值;
利用所述第一损失值,调整所述波形生成模型的网络参数,或者,利用所述第二损失值,调整所述波形鉴别模型的网络参数。
8.根据权利要求7所述的方法,其特征在于,所述波形生成模型是经若干次训练得到的;所述利用所述第一损失值,调整所述波形生成模型的网络参数,或者,利用所述第二损失值,调整所述波形鉴别模型的网络参数,包括:
在当前训练次数满足预设条件的情况下,利用所述第一损失值,调整所述波形生成模型的网络参数;
在当前训练次数不满足所述预设条件的情况下,利用所述第二损失值,调整所述波形鉴别模型的网络参数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于科大讯飞股份有限公司,未经科大讯飞股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110056064.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食用阿胶的加工工艺
- 下一篇:一种医疗器械精密配件的全智能气动作业工艺