[发明专利]评估语音增强算法性能的方法及装置、电子设备有效
申请号: | 201911157422.9 | 申请日: | 2019-11-22 |
公开(公告)号: | CN110853664B | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 杨玉红;蔡林君;相非;李世聪;冯佳倩;涂卫平;艾浩军 | 申请(专利权)人: | 北京小米移动软件有限公司 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L21/0232;G10L15/22;G10L25/51;G10L25/60 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 王茹 |
地址: | 100085 北京市海淀*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 评估 语音 增强 算法 性能 方法 装置 电子设备 | ||
本公开是关于一种评估语音增强算法性能的方法及装置、电子设备。一种评估语音增强算法性能的方法,包括:获取近端音频采集设备采集的第一带噪语音信号和远端音频采集设备采集的第二带噪语音信号;基于所述第一带噪语音信号和所述第二带噪语音信号估计出类纯净语音信号,将所述类纯净语音信号作为参考语音信号;以及利用预设的语音增强算法对所述第二带噪语音信号进行语音增强,获得待测降噪语音信号;基于所述参考语音信号和所述待测降噪语音信号评估所述语音增强算法。本实施例中利用类纯净语音信号作为参考语音信号,可以更逼近机器成功识别的阈值,有利于提升评估结果的准确度。
技术领域
本公开涉及控制技术领域,尤其涉及一种评估语音增强算法性能的方法及装置、电子设备。
背景技术
自动语音识别(ASR,Automatic Speech Recognition)是实现人机交互最为关键的技术,其所要解决的根本问题是让计算机识别出人类的语音,将语音转化为文本。为提高语音识别率,最重要的一步就是语音增强,即对语音进行降噪处理,例如让低信噪比的语音变成高信噪比,进而提高语音质量,降低识别错误率。因此,非常有必要利用语音质量评价算法去评估语音增强算法的性能参数。
以语音质量评价算法采用短时可懂度(STOI,Short-Time ObjectiveIntelligibility Measure)为例,该STOI是通过比较纯净语音和待测降噪语音信号的频谱关系,建立了符合人耳听觉感知的语音质量客观评价模型。其中,纯净语音是指没有失真也没有噪音污染的语音。
需要说明的是,STOI是针对人耳听觉的,以预测听者对目标信号的理解能力,其与主观听音测试能够达成较好的相关性,由于听者的主观听觉感受和机器识别存在差异,使STOI预测结果和后端机器识别结果两者的相关度不高。这是因为,现有STOI没有考虑到语音增强算法的特点,即语音增强算法一般无法得到完全纯净的语音参考信号,使得语音增强后的语音信号中噪声仍然过大或语音信号削弱的情况,这样后续的语音识别模型会存在一定的鲁棒性适应该特点。换言之,当参考语音信号为纯净语音时,对语音增强算法的评估结果会存在一定的误差,不利于语音增强算法性能的判断。
发明内容
本公开提供一种评估语音增强算法性能的方法及装置、电子设备,以解决相关技术的不足。
根据本公开实施例的第一方面,提供一种评估语音增强算法性能的方法,包括:
获取第一带噪语音信号和第二带噪语音信号,其中第一带噪语音信号由靠近发声源的近端音频采集设备采集,第二带噪语音信号由远离所述发声源的远端音频采集设备采集;
基于所述第一带噪语音信号和所述第二带噪语音信号获取类纯净语音信号,将所述类纯净语音信号作为参考语音信号;
利用预设的语音增强算法对所述第二带噪语音信号进行语音增强处理,获得待测降噪语音信号;
获取所述参考语音信号和所述待测降噪语音信号的相关系数,所述相关系数用于评估所述语音增强算法。
可选地,基于所述第一带噪语音信号和所述第二带噪语音信号获取类纯净语音信号,将所述类纯净语音信号作为参考语音信号包括:
分别对所述第一带噪语音信号和所述第二带噪语音信号进行预处理;所述预处理包括分帧和加窗;
分别对预处理后的所述第一带噪语音信号和所述第二带噪语音信号作傅里叶变换,得到所述第一带噪语音信号和所述第二带噪语音信号的时频单元;
获取类纯净语音信号;所述类纯净语音信号与所述第一带噪语音信号、所述第一带噪语音信号与所述第二带噪语音信号的每个时频单元之间的总残差相关;
确定所述总残差最小时的类纯净语音信号作为最终的类纯净语音信号;
将所述最终的类纯净语音信号进行逆傅里叶变换,得到所述参考语音信号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京小米移动软件有限公司,未经北京小米移动软件有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911157422.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种毛毡卡紧装置
- 下一篇:一种带集流体冷却流道的锂离子电池