[发明专利]结合AI模型的语音增强方法、系统、电子设备和介质有效
申请号: | 202010173740.0 | 申请日: | 2020-03-13 |
公开(公告)号: | CN111445919B | 公开(公告)日: | 2023-01-20 |
发明(设计)人: | 康力;叶顺舟;陆成;巴莉芳 | 申请(专利权)人: | 紫光展锐(重庆)科技有限公司 |
主分类号: | G10L21/0216 | 分类号: | G10L21/0216;G10L21/0232;G10L21/0264;G10L25/21;G10L25/30 |
代理公司: | 上海弼兴律师事务所 31283 | 代理人: | 薛琦;张冉 |
地址: | 400700 重庆市*** | 国省代码: | 重庆;50 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 结合 ai 模型 语音 增强 方法 系统 电子设备 介质 | ||
本发明公开了一种结合AI模型的语音增强方法、系统、电子设备和介质,其中结合AI模型的语音增强方法包括以下步骤:根据目标AI模型获取语音存在概率;根据语音存在概率得到噪声功率;根据噪声功率得到先验信噪比;根据先验信噪比得到语音增强增益。本发明可以在复杂嘈杂场景下改善语音的可懂度,也能提高关键词唤醒和语音识别功能的性能。
技术领域
本发明属于语音增强技术领域,尤其涉及一种结合AI模型的语音增强方法、系统、电子设备和介质。
背景技术
当人处于嘈杂的环境中进行通话时,比如汽车,街道或咖啡馆中,环境中的噪声使得远端处的用户分心,理解困难,使得交流不顺利。类似场景下,如果使用虚拟助手(Virtual Assistant),其关键词唤醒(voice trigger detection)功能和自动语音识别(Automatic speech detection)功能都会出现误识率增加,识别率降低的现象,造成使用困难。
语音增强的目的是从带噪语音中分离出干净语音信号。得到的语音信号能够使得通话更清晰,可懂度更高,使得人与人之间交流更高效。也能帮助虚拟助手更好地理解用户的目的,提高用户体验。语音增强已经进行了数十年的研究,广泛用于通信,安防,家居等场景。相较于麦克风阵列技术,单通道的语音增强具有非常广泛的应用场景。一方面,单通道语音增强成本低,使用更加灵活便捷。另一方面,单通道语音增强无法利用到达角等空间信息,对于复杂场景,尤其是非平稳噪声场景,处理起来非常困难。
传统的语音增强的处理方法是建立在语音信号和噪声信号的统计分析之上的。一旦遇到不符合预期的统计特征,则语音增强的效果会减弱,或者降噪性能下降,或者语音失真增多。
传统的单通道语音增强技术基于两个假设,一是噪声信号的非平稳性比语音信号要弱,二是噪声信号和语音信号,其幅度都满足高斯分布。基于这些假设,参照图1,传统的单通道语音增强的方法分为两个步骤,一是噪声功率谱估计,二是语音增强增益计算。噪声功率谱估计根据当前带噪语音信号估计出当中可能包含的噪声,更新噪声功率谱。增益计算部分根据噪声功率谱估计先验信噪比,并计算增益。输入的带噪语音信号乘以计算出来的增益,就得到了增强后的语音信号。
传统方法在计算语音存在概率时,假设噪声信号和语音信号符合高斯分布。基于这个假设,然后使用贝叶斯后验概率公式能够计算出语音存在概率,是一个后验概率。然后使用语音存在概率估计噪声功率谱。这样就完成了噪声估计。
在增益计算部分,可以利用这个噪声功率估计先验信噪比和计算增益。先验信噪比的估计有判决引导法(DD),倒谱平滑,改进型的判决引导法,等等。增益计算有多种方法,分别是维纳(Wiener)滤波,最小均方误差估计(MMSE-STSA),对数域最小均方误差估计(MMSE-LogSTSA),以及最优对数幅度谱估计(OMLSA)。
最后将输入带噪语音信号乘以这个增益,就可以得到增强后的语音信号。传统的语音增强的处理方法是建立在语音信号和噪声信号的统计分析的基础之上。这些统计分析主要用于语音存在概率的估计。一旦遇到不符合预期的统计特征,比如一些非平稳噪声,则语音增强的效果会下降。
发明内容
本发明要解决的技术问题是为了克服现有技术中语音增强效果不佳的缺陷,提供一种结合AI模型的语音增强方法、系统、电子设备和介质。
本发明是通过下述技术方案来解决上述技术问题:
本发明提供一种结合AI模型的语音增强方法,包括以下步骤:
根据目标AI(人工智能)模型获取语音存在概率;
根据语音存在概率得到噪声功率;
根据噪声功率得到先验信噪比;
根据先验信噪比得到语音增强增益。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于紫光展锐(重庆)科技有限公司,未经紫光展锐(重庆)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010173740.0/2.html,转载请声明来源钻瓜专利网。