[发明专利]一种基于WaveNet的骨导语音增强波形生成方法有效

申请号：	201910590941.8	申请日：	2019-07-02
公开（公告）号：	CN110648684B	公开（公告）日：	2022-02-18
发明（设计）人：	张雄伟;郑昌艳;杨吉斌;曹铁勇;李莉;孙蒙	申请（专利权）人：	中国人民解放军陆军工程大学
主分类号：	G10L21/0232	分类号：	G10L21/0232;G10L21/0332;G10L25/18;G10L25/27
代理公司：	南京理工大学专利中心 32203	代理人：	薛云燕
地址：	210007 江***	国省代码：	江苏;32
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于 wavenet 导语增强波形生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于WaveNet的骨导语音增强波形生成方法，其特征在于，包括以下步骤：

步骤1、构建基于BLSTM的幅度谱增强模型和基于WaveNet的波形生成模型，在基于WaveNet的波形生成模型中引入跨采样率的上采样模块；

步骤2、分别训练基于BLSTM的幅度谱增强模型和基于WaveNet的波形生成模型，其中基于BLSTM的幅度谱增强模型的输入为采样率s_low下骨导语音幅度谱，输出目标为采样率s_low下气导语音幅度谱；基于WaveNet的波形生成模型的输入为采样率s_low下骨导语音相位信息和气导语音幅度谱，输出目标为采样率s_high下气导语音波形；其中s_low＜s_high；

步骤3、将待增强的采样率s_low下骨导语音幅度谱送入训练好的基于BLSTM的幅度谱增强模型中得到增强的幅度谱，再将该增强的幅度谱联合骨导语音相位信息送入训练好的基于WaveNet的波形生成模型中，得到增强的采样率s_high下语音波形。

2.根据权利要求1所述的基于WaveNet的骨导语音增强波形生成方法，其特征在于，步骤1所述跨采样率的上采样模块，具体为：

设置两种采样率即s_low、s_high条件下语音特征的分帧窗长时间与窗移时间一致，使得帧级特征分辨率均为1/t_hop，t_hop表示分帧窗移时间；同时，采用线性差值的上采样方法。

3.根据权利要求1或2所述的基于WaveNet的骨导语音增强波形生成方法，其特征在于，步骤2中骨导语音幅度谱、气导语音幅度谱、骨导语音相位信息通过以下方式获取：

步骤2.1、对骨导语音x和气导语音y分别进行波形幅度归一化，归一化到[-1,1]之间，得到归一化骨导语音x'和归一化气导语音y'；

步骤2.2、抽取骨导语音和气导语音的声学特征，得到骨导语音幅度谱M_x、气导语音幅度谱M_y、骨导语音相位信息，所述骨导语音相位信息具体为骨导语音群时延特征GD_x；

步骤2.3、对骨导语音幅度谱M_x和气导语音幅度谱M_y分别进行声学特征取log，并进行MVN归一化处理，得到归一化的骨导语音幅度谱M′_x和归一化的气导语幅度谱M′_y。

4.根据权利要求3所述的基于WaveNet的骨导语音增强波形生成方法，其特征在于，步骤2中对基于BLSTM的幅度谱增强模型的训练，具体如下：

步骤3.1、设置学习率为η_B，训练迭代次数为N_B；

步骤3.2、将归一化后骨导语音幅度谱M′_x送入基于BLSTM的幅度谱增强模型得到估计幅度谱

步骤3.3、根据均方误差函数MSE更新BLSTM参数θ_B为表示与M′_y之间的MSE损失函数误差；其中θ_B为基于BLSTM的幅度谱增强模型的参数；

步骤3.4、循环迭代步骤3.2～3.3，直到达到最大迭代次数N_B。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军工程大学，未经中国人民解放军陆军工程大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910590941.8/1.html，转载请声明来源钻瓜专利网。

上一篇：计算机X射线断层成像系统上消除噪声的方法和装置
下一篇：设备检测方法、装置、电子设备和可读存储介质

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于WaveNet的骨导语音增强波形生成方法有效

专利文献下载