[发明专利]一种语音的话音与非话音的综合判决方法在审
申请号: | 202210006259.1 | 申请日: | 2022-01-05 |
公开(公告)号: | CN114242116A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 代策宇;张义林;徐杨辉;傅松;段绍楠 | 申请(专利权)人: | 成都锦江电子系统工程有限公司 |
主分类号: | G10L25/78 | 分类号: | G10L25/78;G10L25/87;G10L25/30;G10L25/24;G10L25/21;G10L25/18;G10L21/0208 |
代理公司: | 成都立新致创知识产权代理事务所(特殊普通合伙) 51277 | 代理人: | 刘俊 |
地址: | 610000 *** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 话音 综合 判决 方法 | ||
本发明涉及一种语音的话音与非话音的综合判决方法,包括:对输入的语音数据进行分帧处理得到第一分帧语音数据和第二分帧语音数据;对第一分帧语音数据进行预处理,获取每帧语音数据进行时频转换与倒谱系数,并将经过预处理后的数据输入语音识别网络判断语音的话音段占整个语音段的比例;当话音信号占比大于预设值时,通过结合短时自相关法与谱减法的方法进行语音降噪处理;结合短时相关法与能熵比的方法对语音端点进行检测,并将检测后的语音数据中话音语段标记为话音,其余语段标记为非话音,最后输出话音数据。本发明提高了语音判决的适用性,使得在复杂情况下的话音与非话音的判决的适用范围增大,进一步提高方法在语音判决的适用性。
技术领域
本发明涉及语音处理技术领域,尤其涉及一种语音的话音与非话音的综合判决方法。
背景技术
对于语音的话音与非话音的判决,现有的技术方法大致可分为三种:基于阈值的判决方法、作为分类器的判决方法与基于模型的判决方法。其中,基于阈值的判决方法,也就是语音的端点检测方法,是通过提取语音的时域与频域特征,如短时能量、短时过零率、倒谱系数等,设置合理的门限,达到对话音与非话音的判决;分类器的判决方法,是将语音判决作为话音与非话音的分类问题,利用神经网络与机器学习的方法训练分类器,达到判决的目的;基于模型的方法,是利用一个完整的声学模型,在解码的基础上,通过全局信息进行判决。
但是现有的话音与非话音的判决方法,其判决的条件都是基于在需要判决的语音段上,话音含有的是同种类型、信噪比不变的噪声。并且为达到良好的降噪效果,在进行去噪处理时,都假设语音段的初始若干帧的语音为非话音帧,即噪声帧。以上述的初始的若干非话音帧作为本段语音的背景噪声进行降噪与话音的判决。
而现有的基于分类器与模型的判决方法,需要对每帧信号都进行话音与非话音的判决,后续还需采取其它方法消除判决所带来的偏差,且为达到对话音信号的准确判决,需要大量不同的训练数据对网络或者模型进行训练与构建,前期所需工作较复杂。
因此,现有技术的所需判决的语音的条件比较理想,无法对初始段为话音的语音或者背景噪声复杂、多种信噪比并存的条件下自适应确定噪声帧以及需要语音数据训练网络与构建模型来进行语音的判决。
发明内容
本发明的目的在于克服现有技术的缺点,提供了一种语音的话音与非话音的综合判决方法,解决了现有技术中存在的问题。
本发明的目的通过以下技术方案来实现:一种语音的话音与非话音的综合判决方法,所述综合判决方法包括:
对输入的语音数据进行分帧处理得到第一分帧语音数据和第二分帧语音数据;
所述第一分帧语音数据的处理方法包括:
对第一分帧语音数据进行预处理,获取每帧语音数据进行时频转换与倒谱系数,并将经过预处理后的数据输入语音识别网络判断语音的话音段占整个语音段的比例;
当话音信号占比大于预设值时,通过结合短时自相关法与谱减法的方法进行语音降噪处理;
结合短时相关法与能熵比的方法对语音端点进行检测,并将检测后的语音数据中话音语段标记为话音,其余语段标记为非话音,最后输出语音数据;
所述第二分帧语音数据的处理方法包括:
通过结合短时自相关法与谱减法的方法对第二分帧语音数据进行语音降噪处理;
结合短时相关法与能熵比的方法对语音端点进行检测,并将检测后的语音数据中话音语段标记为话音,其余语段标记为非话音,最后输出语音数据。
所述对第一分帧语音数据进行预处理,获取每帧语音数据进行时频转换与倒谱系数包括:
将第一分帧语音数据通过短时傅里叶变换获取的语音数据的时频参数F(f,t),表示语音信号在时刻为t,频率为f时的信号的相对能量值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都锦江电子系统工程有限公司,未经成都锦江电子系统工程有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210006259.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高地隙喷雾机药箱转动及升降装置
- 下一篇:一种用于交通运输的两栖车辆