[发明专利]一种语音增强方法、装置以及处理设备有效
申请号: | 202110852033.9 | 申请日: | 2021-07-27 |
公开(公告)号: | CN113793619B | 公开(公告)日: | 2023-10-13 |
发明(设计)人: | 李登实;赵兰馨;高雨;官端正 | 申请(专利权)人: | 江汉大学 |
主分类号: | G10L21/0208 | 分类号: | G10L21/0208;G10L25/30;G10L25/03;G10L13/047;G06N3/0475;G06N3/094 |
代理公司: | 北京众达德权知识产权代理有限公司 11570 | 代理人: | 张晓冬 |
地址: | 430056 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 增强 方法 装置 以及 处理 设备 | ||
本申请提供了一种语音增强方法、装置以及处理设备,用于实现一种语音增强机制,保障高精度的降噪处理,以具有更高的实用价值。方法包括:处理设备获取发送方发送的第一语音数据;处理设备提取第一语音数据的第一语音特征以及第一背景噪声分贝特征;处理设备采集自身所处环境的第二背景噪声分贝特征;处理设备将第一语音特征、第一背景噪声分贝特征以及第二背景噪声分贝特征输入语音特征处理模型,并得到语音特征处理模型输出的第二语音特征;处理设备根据第二语音特征,对第一语音数据进行语音增强处理,得到第二语音数据。
技术领域
本申请涉及语音领域,具体涉及一种语音增强方法、装置以及处理设备。
背景技术
可以理解,在语音通话过程中,经常由于双方的所处环境都存在不同的环境噪声,从而导致采集到的语音以及播放的语音的清晰度,都出现一定程度下降的情况,在该情况下,容易丢失一些通话内容的丢失,影响了通话质量。因此,降噪处理,为语音通话过程中的一大重要的处理功能。
所谓降噪,可以理解为降低语音中的环境噪声,从而使得语音中的人声更加的突出、清晰,达到提升语音质量的目的。
而在现有的相关技术的研究过程中,发明人发现,其对于语音中存在的噪声,降噪精度有限,仍存在一定的优化空间,方可适于实用。
发明内容
本申请提供了一种语音增强方法、装置以及处理设备,用于实现一种语音增强机制,保障高精度的降噪处理,以具有更高的实用价值。
第一方面,本申请提供了一种语音增强方法,方法包括:
处理设备获取发送方发送的第一语音数据;
处理设备提取第一语音数据的第一语音特征以及第一背景噪声分贝特征;
处理设备采集自身所处环境的第二背景噪声分贝特征;
处理设备将第一语音特征、第一背景噪声分贝特征以及第二背景噪声分贝特征输入语音特征处理模型,并得到语音特征处理模型输出的第二语音特征,其中,语音特征处理模型是由随机抽取两组语音数据,并将第三语音数据对应的第三语音特征以及第三背景噪声分贝特征,以及第四语音数据对应的第四语音特征以及第四背景噪声分贝特征作为训练集,输入StarGAN模型,使得StarGAN模型以第三背景噪声分贝特征转换为第四背景噪声分贝特征为转换条件,并以第四语音特征作为转换目标,对第三语音特征进行语音特征变换处理,进行模型的训练得到的;
处理设备根据第二语音特征,对第一语音数据进行语音增强处理,得到第二语音数据。
结合本申请第一方面,在本申请第一方面第一种可能的实现方式中,在处理设备将第一语音特征、第一背景噪声分贝特征以及第二背景噪声分贝特征输入语音特征处理模型,并得到语音特征处理模型输出的第二语音特征之前,方法还包括:
处理设备获取语音数据集合;
处理设备提取语音数据集合中每组语音数据对应的语音特征以及背景噪声分贝特征;
在每一轮的模型训练过程中,处理设备随机抽取两组语音数据,并将第三语音数据对应的第三语音特征以及第三背景噪声分贝特征,以及第四语音数据对应的第四语音特征以及第四背景噪声分贝特征作为训练集,输入StarGAN模型,使得StarGAN模型以第三背景噪声分贝特征转换为第四背景噪声分贝特征作为转换条件,以第四语音特征作为转换目标,对第三语音特征进行语音特征变换处理,进行模型的训练。
结合本申请第一方面第一种可能的实现方式,在本申请第一方面第二种可能的实现方式中,语音数据集合具体包括在零分贝的背景噪声下采集的语音数据以及在不同分贝的背景噪声下采集到的Lombard语音数据,Lombard语音数据是指在发送方为降低干扰、提高语音可懂度时调整了说话方式的场景下得到的语音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江汉大学,未经江汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110852033.9/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种用于锂电池注液封口的拉铆密封方法
- 下一篇:翅片结构、换热器及空调器