[发明专利]一种融合滤波与学习的在线语音增强方法及装置在审
申请号: | 202111392458.2 | 申请日: | 2021-11-19 |
公开(公告)号: | CN113990341A | 公开(公告)日: | 2022-01-28 |
发明(设计)人: | 余炜平;赵宇;于伟;周斌;鲁敏 | 申请(专利权)人: | 上海瀚讯信息技术股份有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0216;G10L21/0332;G10L25/30 |
代理公司: | 上海智信专利代理有限公司 31002 | 代理人: | 杨怡清 |
地址: | 200335 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 滤波 学习 在线 语音 增强 方法 装置 | ||
1.一种融合滤波与学习的在线语音增强方法,其特征在于,包括:
步骤S1,实时获取原始带噪语音信号,对所述原始带噪语音信号进行卡尔曼滤波,得到滤波后的实时语音信号;
步骤S2,根据所述原始带噪语音信号、所述滤波后的实时语音信号以及一离线语料库,进行DNN训练,得到训练权重;
步骤S3,根据所述原始带噪语音信号和所述训练权重,进行DNN增强,得到增强后的语音信号;
步骤S4,对所述滤波后的语音信号和所述增强后的语音信号进行性能比较,获取输出语音信号。
2.根据权利要求1所述的融合滤波与学习的在线语音增强方法,其特征在于,所述步骤S2包括:
步骤S21,判断所述原始带噪语音信号是否为背景噪声,若是,则将其作为实时背景噪声信号输出,进入步骤S22;若否,则结束流程;
步骤S22,将所述滤波后的实时语音信号和所述实时背景噪声信号分别与所述离线语料库中的语料进行整合,得到训练用干净语音数据块和训练用含噪语音数据块;
步骤S23,对所述训练用干净语音数据块和所述训练用含噪语音数据块进行特征提取,得到训练用干净语音特征和训练用含噪语音特征;
步骤S24,以所述训练用干净语音特征为参考,对所述训练用含噪语音特征进行有监督训练,得出训练权重w。
3.根据权利要求2所述的融合滤波与学习的在线语音增强方法,其特征在于,所述步骤S22包括:
步骤S221,分别对所述滤波后的实时语音信号和所述实时背景噪声信号进行缓存,获取实时语音数据块和实时背景噪声数据块;
步骤S222,将所述实时语音数据块和所述实时背景噪声数据块相加,获取实时含噪语音数据块;
步骤S223,获取所述离线语料库中的离线干净语音数据块和离线含噪语音数据块,将所述实时语音数据块与所述离线干净语音数据块进行拼接,得到训练用干净语音数据块;将所述实时含噪语音数据块与所述离线含噪语音数据块进行拼接,得到训练用含噪语音数据块。
4.根据权利要求1所述的融合滤波与学习的在线语音增强方法,其特征在于,所述步骤S3包括:
步骤S31,对所述原始带噪语音信号进行特征提取,得到原始带噪语音特征;
步骤S32,根据所述训练权重,对所述原始带噪语音特征进行增强,获取增强后的原始带噪语音特征;
步骤S33,对所述增强后的原始带噪语音特征进行波形重构,得到增强后的语音信号。
5.根据权利要求1所述的融合滤波与学习的在线语音增强方法,其特征在于,所述步骤S4中获取输出语音信号的方法为:若所述滤波后的语音信号性能优于所述增强后的语音信号,则以滤波后的语音信号作为输出语音信号;若所述增强后的语音信号性能优于所述滤波后的语音信号,则以增强后的语音信号作为输出语音信号。
6.一种融合滤波与学习的在线语音增强装置,其特征在于,包括:
卡尔曼滤波模块,设置为实时获取原始带噪语音信号,对所述原始带噪语音信号进行卡尔曼滤波,得到滤波后的实时语音信号;
DNN训练模块,与所述卡尔曼滤波模块相连,并设置为根据所述原始带噪语音信号、所述滤波后的实时语音信号以及一离线语料库,进行DNN训练,得到训练权重;
DNN增强模块,与所述DNN训练模块相连,并设置为根据所述原始带噪语音信号和所述训练权重,进行DNN增强,得到增强后的语音信号;
性能比较模块,分别与所述卡尔曼滤波模块和所述DNN增强模块相连,并设置为对所述滤波后的语音信号和所述增强后的语音信号进行性能比较,获取输出语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海瀚讯信息技术股份有限公司,未经上海瀚讯信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111392458.2/1.html,转载请声明来源钻瓜专利网。