[发明专利]语音增强方法有效
| 申请号: | 201910296437.7 | 申请日: | 2016-01-14 |
| 公开(公告)号: | CN110070883B | 公开(公告)日: | 2023-07-28 |
| 发明(设计)人: | 张军;陈鑫源;潘伟锵;宁更新;冯义志;余华;季飞;陈芳炯 | 申请(专利权)人: | 深圳市韶音科技有限公司 |
| 主分类号: | G10L21/0272 | 分类号: | G10L21/0272;G10L21/038 |
| 代理公司: | 深圳市威世博知识产权代理事务所(普通合伙) 44280 | 代理人: | 李庆波 |
| 地址: | 518108 广东省深圳市宝安区石*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 语音 增强 方法 | ||
1.一种语音增强方法,其特征在于,包括:
同步采集气导检测语音和非气导检测语音,检测气导检测语音的端点,然后利用气导检测语音的纯噪声段建立气导噪声统计模型;
利用所述气导噪声统计模型修正联合统计模型,并对气导检测语音帧进行分类;
根据分类结果对应的气导语音线性频谱统计模型和气导噪声统计模型计算最佳气导语音滤波器;
利用所述最佳气导语音滤波器对气导检测语音进行滤波增强后得到滤波增强语音,
根据非气导语音到气导语音的映射模型,将非气导检测语音转换为气导的映射语音;
计算第帧的滤波增强语音的权重和第帧的映射语音的权重;
通过以下公式将滤波增强语音与映射语音加权叠加,得到融合增强语音:
;
其中,所述滤波增强语音是对同步采集的气导检测语音和非气导检测语音中的气导检测语音进行增强滤波获得,所述映射语音是对非气导检测语音进行非气导语音到气导语音的转换获得;所述联合统计模型和所述气导语音线性频谱统计模型由同步采集的干净的气导训练语音和非气导训练语音预先建立,所述联合统计模型为倒频域联合统计模型;所述映射模型由所述同步采集的干净的气导训练语音和非气导训练语音预先建立;
其中,将所述气导的映射语音与所述滤波增强语音进行加权融合的步骤之前,进一步包括:
根据对气导检测语音进行端点检测得到的语音信号起点时刻,截取滤波增强语音中信号起点前的所有数据帧,求平均功率作为噪声帧的功率;
信噪比通过以下公式计算:
其中是第帧滤波增强语音的功率。
2.根据权利要求1所述的方法,其特征在于,所述权重和通过以下公式计算:
;
;
其中,和分别为第帧滤波增强语音和映射语音的幅度方差,为第帧滤波增强语音的信噪比,、为预设的常数。
3.根据权利要求1所述的方法,其特征在于,所述同步采集气导检测语音和非气导检测语音,检测气导检测语音的端点,然后利用气导检测语音的纯噪声段建立气导噪声统计模型的步骤包括:
同步采集气导检测语音和非气导检测语音并分帧;
根据非气导检测语音帧的短时自相关函数和短时能量,计算每帧非气导检测语音帧的短时平均过门限率,当所述短时平均过门限率大于预设的门限值时,判断所述非气导检测语音帧为语音信号,否则为噪声;
根据每个所述非气导检测语音帧的判决结果得到非气导检测语音信号的端点位置;
将检测到的所述非气导检测语音信号端点对应的时刻作为气导检测语音的端点,提取气导检测语音中的纯噪声段;
计算气导检测语音中纯噪声段信号的线性频谱均值,保存该均值为气导噪声的统计模型参数。
4.根据权利要求3所述的方法,其特征在于,所述短时平均过门限率通过以下公式计算:
;
其中为取符号运算,为调节因子,为窗函数,为门限初值,为所述短时自相关函数,为所述短时能量,为所述短时平均过门限率。
5.根据权利要求1所述的方法,其特征在于,所述联合统计模型通过以下步骤进行修正:
将联合统计模型的参数转换到线性频谱域;
按气导干净语音和气导噪声在线性频谱域是加性关系对联合统计模型中的气导语音数据流参数进行修正;
将修正后的线性频谱域联合统计模型参数转换回原来的特征域,得到修正后的联合统计模型;
其中,所述联合统计模型中的所述气导语音数据流参数为混合高斯模型或隐马尔科夫模型中高斯分量的均值和协方差。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市韶音科技有限公司,未经深圳市韶音科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910296437.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:语音分离方法、语音识别方法及电子设备
- 下一篇:音频起始点检测方法和装置





