[发明专利]语音增强方法有效

申请号：	201910296437.7	申请日：	2016-01-14
公开（公告）号：	CN110070883B	公开（公告）日：	2023-07-28
发明（设计）人：	张军;陈鑫源;潘伟锵;宁更新;冯义志;余华;季飞;陈芳炯	申请（专利权）人：	深圳市韶音科技有限公司
主分类号：	G10L21/0272	分类号：	G10L21/0272;G10L21/038
代理公司：	深圳市威世博知识产权代理事务所(普通合伙) 44280	代理人：	李庆波
地址：	518108 广东省深圳市宝安区石***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	语音增强方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明公开一种语音增强方法，包括：计算第m帧的滤波增强语音xsubgt;m/subgt;的权重和第m帧的映射语音ysubgt;m/subgt;的权重通过以下公式将滤波增强语音xsubgt;m/subgt;与映射语音ysubgt;m/subgt;加权叠加，得到融合增强语音：其中滤波增强语音是对同步采集的气导检测语音和非气导检测语音中的气导检测语音进行增强滤波获得，映射语音是对非气导检测语音进行非气导语音到气导语音的转换获得。

技术领域

本发明是申请人于2016年01月14日提出的名为“一种基于统计模型的双传感器语音增强方法与装置”、申请号为201610025390的专利申请的分案申请，本发明涉及数字信号处理领域，特别涉及一种语音增强方法。

背景技术

通信是现代人与人之间进行交流的重要手段，而语音作为通信系统中最常见的形式，其质量直接影响了人们获取信息的准确性。语音在传播的过程中，难免受到各种各样环境噪声的干扰，其音质、可懂度都将明显下降，因此在实际应用中往往会利用语音增强技术对噪声环境下的语音进行处理。

语音增强技术能从噪声背景中提取有用的语音信号，是抑制、降低噪声干扰的基本手段。传统的语音增强对象是基于空气传导传感器(如麦克风等)采集的语音信号，根据处理方式的不同，常用的语音增强技术可以分为基于模型的方法和非基于模型的方法两类。非基于模型的增强方法有谱减法、滤波法、小波变换法等，它们通常假定噪声是相对平稳的，当噪声变化过快时，其增强效果并不能令人满意。基于模型的语音增强方法则首先对语音信号和噪声信号建立统计模型，然后通过模型获取干净语音的最小均方误差估计或最大后验概率估计。这类方法能够避免音乐噪声的产生，并能处理非平稳噪声。但由于上述的基于模型和非基于模型的方法均基于麦克风等空气传导语音传感器，其信号容易受环境中的声学噪声影响，特别是在强噪声环境下，系统性能会大幅度下降。

为解决强噪声对语音处理系统的影响，有别于传统的空气传导传感器，非空气传导的语音传感器利用说话人声带、颚骨等部位的振动来带动传感器中的簧片或者碳膜发生变化，改变其电阻值,使其两端的电压发生变化，从而将振动信号转化为电信号，即语音信号。由于空气中传导的声波无法使非空气传导传感器的簧片或者碳膜发生形变，因此非空气传导传感器不受空气传导声音的影响，具有很强的抗环境声学噪声干扰的能力。但因非空气传导传感器采集的是通过颚骨、肌肉、皮肤等的振动传播的语音，表现为发闷、含糊不清，其高频部分丢失严重，语音可懂度较差，制约了非空气传导技术的实际应用。

鉴于空气传导与非空气传导传感器的单独应用都存在一定的缺陷，近年来出现了一些结合两者优点的语音增强方法。这些方法利用空气传导传感器语音和非空气传导传感器语音的互补性，采用多传感器融合技术来实现语音增强的目的，通常能取得比单传感器语音增强系统更好的效果。但现有的空气传导传感器与非空气传导传感器结合的语音增强方法还存在以下不足：(1)空气传导传感器语音与非空气传导传感器语音通常独立地进行恢复处理，然后再将两者恢复后的语音进行融合，未能在空气传导传感器语音和非空气传导传感器语音的恢复过程中充分利用两者之间的互补性；(2)在多变的强噪音环境下，空气传导传感器语音纯语音段的统计特性会被严重干扰，增强语音的信噪比也会降低，导致融合后语音增强效果不明显。

发明内容

本发明提供一种语音增强方法，包括：计算第m帧的滤波增强语音x_m的权重和第m帧的映射语音y_m的权重通过以下公式将滤波增强语音x_m与映射语音y_m加权叠加，得到融合增强语音：其中滤波增强语音是对同步采集的气导检测语音和非气导检测语音中的气导检测语音进行增强滤波获得，映射语音是对非气导检测语音进行非气导语音到气导语音的转换获得。

本发明相对于现有技术具有如下的优点及效果：

1、本发明在气导语音增强过程中，结合非气导传感器语音和气导传感器语音来构建当前用于分类的语音统计模型以及进行端点检测，并据此构造最佳气导语音滤波器，提高了气导语音的增强效果，显著增加了整个系统的鲁棒性；

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市韶音科技有限公司，未经深圳市韶音科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201910296437.7/2.html，转载请声明来源钻瓜专利网。

上一篇：语音分离方法、语音识别方法及电子设备
下一篇：音频起始点检测方法和装置

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L21-00 为了改变语音信号的质量或其可识度而处理语音信号，以产生另一种可听的或非可听的信号，例如视觉信号或触觉信号
G10L21-02 .语音增强，例如降低噪声或消除回声
G10L21-04 .时间压缩或扩展
G10L21-06 .将语音转换成非可听表达形式，例如语音可视化、触觉辅助的语音处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]语音增强方法有效

专利文献下载