[发明专利]基于编解码器架构与递归神经网络的骨导语音盲增强方法有效
申请号: | 201810960512.0 | 申请日: | 2018-08-22 |
公开(公告)号: | CN108986834B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 张雄伟;单东晶;郑昌艳;曹铁勇;李莉;杨吉斌 | 申请(专利权)人: | 中国人民解放军陆军工程大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L19/005;G10L25/30;G06N3/0442;G06N3/0455;G06N3/08 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 唐代盛 |
地址: | 210007 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 编解码器 架构 递归 神经网络 导语 增强 方法 | ||
本发明公开了一种基于编解码器架构与递归神经网络的骨导语音盲增强方法,首先提取气导和骨导语音特征,对提取的语音特征数据进行对齐预处理,然后以骨导语音特征作为训练输入,以气导语音字典组合系数作为训练目标,作为下一步骤中编码器的初始化参数;构建基于局部注意力机制的解码器模型,以编码器输出作为解码器的输入,以气导语音特征为训练目标,联合训练编解码器模型,并存储模型参数;最后提取待增强的骨导语音特征,利用上述步骤训练好的编解码神经网络实现特征转换,再对神经网络的输出进行反归一化和特征逆变换,最终得到增强后的时域语音。本发明解决高频成分的恢复、骨导无声段恢复及较强噪声背景下的恢复等问题,改善了骨导语音的增强质量。
技术领域
本发明属于语音信号处理技术领域,是一种基于编解码器架构与深度长短时记忆递归神经网络的骨导语音盲增强方法。
背景技术
骨导麦克风是一种非声传感器设备,人说话时声带振动会传递到喉头和头骨,这种麦克风正是通过采集这种振动信号并转换为电信号来获得语音。与传统的空气传导麦克风语音不同,背景噪声很难对这类非声传感器产生影响,所以骨导语音从声源处就屏蔽了噪声,具有很强抗噪性能,在军事和民事上均已得到应用。例如,许多国家在军事装备上,例如武装直升机、坦克中都配备了基于骨导的通讯系统,美国的“未来战士”单兵作战系统中骨导耳机是其重要通信工具,在民用方面,美国iASUS公司,针对赛车、摩托赛车等极限运动,研发了多款喉头麦克风、骨导耳机等设备,日本的松下、索尼等公司也研发出多种骨导通讯产品,并被应用到消防、林业、石油勘测及开采、矿山、紧急救援、特勤、工程建设等领域。
虽然骨导语音能够有效抵抗环境噪声的干扰,但是由于人体信号传导的低通性以及振动信号的固有特点,骨导语音呈现高频部分缺失、中频部分厚重、气流音、鼻腔音缺失等现象,语音听起来比较沉闷、不够清晰,严重影响了人们的听觉感受。另外,骨导语音中也会混入一些非声学的物理噪声,例如设备与紧贴的皮肤产生的摩擦噪声、极限运动时强大的风力摩擦噪声、人咀嚼或牙齿相碰时引入的噪声等,这些噪声也降低了的通信质量。因此,开展对骨导语音增强算法的研究,对进一步推进骨导麦克风产品的实用化进程,改善强噪声环境下的语音通信质量,具有重要的理论意义和实用价值。
目前,骨导语音盲增强主要有三种比较典型的方法:无监督频谱扩展法、均衡法、谱包络转换法。
无监督频谱扩展法(Bouserhal R E,Falk T H,Voix J.In-ear microphonespeech quality enhancement via adaptive filtering and artificial bandwidthextension.[J]. Journal of the Acoustical Society of America.2017)认为骨导语音与气导语音具有一致性的共振峰结构,或者语音的低频与高频之间具有一致的谐波结构,利用这种结构特性,可直接对低频频谱进行扩展,得到增强的高频共振峰或者谐波结构,即实现了骨导语音的盲增强。
均衡法的思想是找到传输通道变换函数h(t)的逆变换函数g(t),从骨导语音信号中恢复出气导语音信号。均衡法首先由Shimamura提出(Shimamura T,Tamiya T.Areconstruction filter for bone-conducted speech[C].Circuits and Systems,2005.Midwest Symposium on,2005.2005:1847-1850),通过建模g(t),并构造逆滤波器实现骨导语音增强。均衡法能够保持语音中低频的谐波结构,并有效压缩骨导语音中过多的能量,但较难恢复骨导语音中的高频成分。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军陆军工程大学,未经中国人民解放军陆军工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810960512.0/2.html,转载请声明来源钻瓜专利网。