[发明专利]语音基音周期检测方法和装置有效
申请号: | 201210592093.2 | 申请日: | 2012-12-29 |
公开(公告)号: | CN103915099A | 公开(公告)日: | 2014-07-09 |
发明(设计)人: | 宋辉 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L19/09 | 分类号: | G10L19/09;G10L25/90 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 基音 周期 检测 方法 装置 | ||
技术领域
本发明涉及信息处理技术领域,特别涉及一种语音基音周期检测方法和装置。
背景技术
语音基音周期是语音信号的一个重要特征,语音基音周期经常应用于语音识别、语音合成、说话人识别等。目前,对语音基音周期的估计技术通常包括两个基本步骤,一是利用语音信号的相关性,逐帧估计出语音基音周期的可能的基音候选项,二是利用语音基音周期在短时间内不可能发生突变的特性,在相邻帧内对各个基音候选项进行局部平滑,得到最终的语音基音周期的估计结果。其中,采用不同的相关性算法和不同的平滑算法,可以构成很多不同的语音基音周期估计方法。
目前存在的问题是,这种语音基音周期检测技术相对于纯净语音信号的效果理想,但在噪音环境下性能下降特别明显。
发明内容
本发明的目的旨在至少解决所述技术缺陷之一。
为此,本发明的第一个目的在于提出一种语音基音周期检测方法,该方法可以有效增加抗噪的效果。
本发明的第二个目的在于提出一种语音基音周期检测装置。
为达到所述目的,本发明第一方面的实施例公开了一种语音基音周期检测方法,包括以下步骤:接收语音输入信号并对所述语音输入信号进行预处理,其中,所述语音输入信号包括多帧语音信号;对所述语音输入信号中的每帧语音信号进行先验信噪比估计以获得每帧语音信号对应的先验信噪比;根据每帧语音信号对应的先验信噪比获得每帧语音信号对应的权重值;提取所述多帧语音信号中的多个基音候选项;根据所述多个基音候选项和先验信噪比按照预设周期对所述多帧语音信号进行第一次动态规划以获得多个第一基音路径及所述第一基音路径对应的代价信息;根据所述第一基音路径对应的代价信息对所述多个第一基音路径进行第二次动态规划以生成至少一个第二基音路径;以及根据所述至少一个第二基音路径检测所述语音基音周期。
为达到所述目的,本发明第二方面的实施例公开了一种语音基音周期检测装置,包括:预处理模块,用于接收语音输入信号并对所述语音输入信号进行预处理,其中,所述语音输入信号包括多帧语音信号;第一获取模块,用于对所述语音输入信号中的每帧语音信号进行先验信噪比估计以获得每帧语音信号对应的先验信噪比;第二获取模块,用于根据每帧语音信号对应的先验信噪比获得每帧语音信号对应的权重值;提取模块,用于提取所述多帧语音信号中的多个基音候选项;第一动态规划模块,用于根据所述多个基音候选项和先验信噪比按照预设周期对所述多帧语音信号进行第一次动态规划以获得多个第一基音路径及所述第一基音路径对应的代价信息;第二动态规划模块,用于根据所述第一基音路径对应的代价信息对所述多个第一基音路径进行第二次动态规划以生成至少一个第二基音路径;以及检测模块,用于根据所述至少一个第二基音路径检测所述语音基音周期。
根据本发明实施例的语音基音周期检测装置,一方面在估计先验信噪比时,逐帧对输入的语音信号进行先验信噪比追踪,并对每帧语音信号赋予不同的权重,可以使得先验信噪比较高的语音信号在后续的动态规划中发挥更主要的作用,增加抗噪的效果,另一方面利用二次规划,可以对噪声造成的偏差进行补偿,进一步增加抗噪的效果。
本发明附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本发明的实践了解到。
附图说明
本发明上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中:
图1为根据本发明一个实施例的语音基音周期检测方法的流程图;
图2为根据本发明另一个实施例的语音基音周期检测方法的流程图;
图3为根据本发明一个具体实施例的语音基音周期检测方法的流程图;
图4为根据本发明另一个具体实施例的语音基音周期检测方法的流程图;
图5为根据本发明再一个具体实施例的语音基音周期检测方法的流程图;
图6为根据本发明一个实施例的语音基音周期检测装置的结构框图;以及
图7为根据本发明另一个实施例的语音基音周期检测装置的结构框图。
具体实施方式
下面详细描述本发明的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过参考附图描述的实施例是示例性的,仅用于解释本发明,而不能解释为对本发明的限制。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210592093.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:信号处理装置及其操作方法
- 下一篇:一种蕲蛇水溶性总蛋白冻干粉的制备方法