[发明专利]一种针对低资源土家语的端到端语音增强方法有效
申请号: | 201910966022.6 | 申请日: | 2019-10-11 |
公开(公告)号: | CN110619886B | 公开(公告)日: | 2022-03-22 |
发明(设计)人: | 于重重;康萌;陈运兵;徐世璇 | 申请(专利权)人: | 北京工商大学 |
主分类号: | G10L21/02 | 分类号: | G10L21/02;G10L21/0208;G10L21/0216;G10L25/30 |
代理公司: | 北京万象新悦知识产权代理有限公司 11360 | 代理人: | 黄凤茹 |
地址: | 100048*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 针对 资源 土家 端到端 语音 增强 方法 | ||
本发明公布了一种针对低资源土家语的端到端语音增强方法,属于语音信号处理领域,涉及低资源语言的语音增强技术,针对土家语数据中环境噪声的多样性、随机性和非平稳性,实现端到端的语音快速增强处理。包括:基于深度卷积生成对抗网络,建立端到端的低资源土家语语音增强模型,进行快速增强处理,实现端到端的土家语语音快速增强处理,在几乎不失真的情况下有效去除土家语语音的环境噪声。
技术领域
本发明属于语音信号处理领域,涉及低资源语言的语音增强技术,具体涉及一种基于深度卷积生成对抗网络针对低资源土家语的端到端语音增强方法。
背景技术
语音增强技术是语音数字信号的预处理部分,主要是从带噪语音信号中尽可能提取纯净的原始语音信号,其目的主要有两点:一是抑制背景噪声,改善语音质量,消除人们的听觉疲劳,这是主观测量;二是提高语音的可懂性,这是客观测量。现在语音识别技术已经进入实用阶段,但许多识别系统对环境要求较高。在实际应用中,环境噪声污染会降低语音处理系统性能。因此语音增强技术能够有效解决噪声污染,提高语音识别系统的准确率。目前语音增强系统在语音通信和多媒体技术等领域已被广泛应用。
传统的语音增强算法有谱减法,其计算量小,可简单控制语音信号失真和残留噪声,但容易残留音乐噪声;自适应滤波如维纳滤波、卡尔曼滤波需要知道噪声的一些特征或统计特性。基于时域的子空间分解也可用于语音增强,但在低信噪比或白噪声的情况下效果更好。随着深度学习的快速发展,对于语音增强来说采用深度神经网络的方法也受到人们的广泛关注,其在非平稳噪声处理中相比传统方法具有明显的优势,但深度网络模型多为有监督训练,模型依赖于大量的标注数据和长时间的训练。
土家语作为我国土家族世代相传的语言,其中蕴含了丰富的民族文化内涵,但由于使用人数急剧减少,口语的传承出现断层现象,且无文本记录形式,已经面临濒危消亡的危机状态。此外土家语的使用范围也极为有限,留存较好的地区处于交通不便、十分闭塞的高山深谷中。在这种情况下不仅可采集的数据量十分有限,而且难以寻得专业的录音室,调查和采集土家语的过程均处于自然环境中,音频文件包含噪声的现象难以避免,其中出现的噪声诸如动物叫声、机动车声、采集设备发出的电流声以及多人同时说话的干扰都会将有用的语音信息淹没在噪声中,更对后续进行土家语标注和语音识别的任务造成影响。
为了确保获得高质量的语料,去除土家语语音数据中的噪声是一项具有挑战性的研究。采用现有的语音去噪方法,难以实现土家语标注和语音识别,土家语语音识别的准确率低。
发明内容
为了克服上述现有技术的不足,本发明提供一种基于深度卷积生成对抗网络的针对低资源土家语的端到端语音增强方法,针对土家语数据中环境噪声的多样性、随机性和非平稳性,实现端到端的语音快速增强处理。
本发明可以为语言数字资源库奠定研究基础,提高后续语音识别的准确率,并且帮助语音学家完成濒危语言的记录和保存工作,更加直观生动地展示语言面貌及其文化内涵,对语言文化保护传承都具有重要的实际意义。
本发明提供的技术方案是:
一种针对低资源土家语的端到端语音增强方法,基于深度卷积生成对抗网络,建立端到端的低资源土家语语音增强模型,实现端到端的土家语语音快速增强处理,有效去除土家语语音的环境噪声,包括以下步骤:
1)构建土家语语料库,对土家语录音数据进行分类和切分,得到土家语原始带噪语料和土家语原始干净语料,并从土家语原始带噪语料中截取得到纯噪声片段:
11)首先根据土家语录音数据的质量将土家语语料分为两部分:无噪声数据 (土家语原始干净语料)和有噪声数据(土家语原始带噪语料)。在有噪声数据中,句与句之间的无人声片段也包含环境噪声,因此可根据语音处理工具(如ELAN软件)将噪声片段截取出来得到纯噪声片段。具体地,土家语原始带噪语料中有人声和无人声的地方均有噪声。将无人声的片段截取出,作为土家语纯噪声片段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工商大学,未经北京工商大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910966022.6/2.html,转载请声明来源钻瓜专利网。