[发明专利]语音基音周期检测方法和装置有效
申请号: | 201210592093.2 | 申请日: | 2012-12-29 |
公开(公告)号: | CN103915099A | 公开(公告)日: | 2014-07-09 |
发明(设计)人: | 宋辉 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G10L19/09 | 分类号: | G10L19/09;G10L25/90 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 宋合成 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 语音 基音 周期 检测 方法 装置 | ||
1.一种语音基音周期检测方法,其特征在于,包括以下步骤:
接收语音输入信号并对所述语音输入信号进行预处理,其中,所述语音输入信号包括多帧语音信号;
对所述语音输入信号中的每帧语音信号进行先验信噪比估计以获得每帧语音信号对应的先验信噪比;
根据每帧语音信号对应的先验信噪比获得每帧语音信号对应的权重值;
提取所述多帧语音信号中的多个基音候选项;
根据所述多个基音候选项和先验信噪比按照预设周期对所述多帧语音信号进行第一次动态规划以获得多个第一基音路径及所述第一基音路径对应的代价信息;
根据所述第一基音路径对应的代价信息对所述多个第一基音路径进行第二次动态规划以生成至少一个第二基音路径;以及
根据所述至少一个第二基音路径检测所述语音基音周期。
2.如权利要求1所述的语音基音周期检测方法,其特征在于,对所述语音输入信号进行预处理进一步包括:
对所述语音输入信号进行分帧处理,并对所述语音输入信号进行噪声估计以获得当前噪声估计信息。
3.如权利要求2所述的语音基音周期检测方法,其特征在于,对所述语音输入信号进行预处理还包括:
对所述语音输入信号进行预加重、加窗及FFT处理。
4.如权利要求1-3任一项所述的语音基音周期检测方法,其特征在于,通过以下公式获得每帧语音信号对应的先验信噪比:
其中,SNRapriori(f,i)表示当前帧语音信号的先验信噪比,X(f,i-1)表示语音信号的频谱,N(f)表示噪声信号的频谱,i表示帧索引,α表示加权因子,SNRpost表示前一帧的先验信噪比。
5.如权利要求4所述的语音基音周期检测方法,其特征在于,通过以下公式获得每帧语音信号对应的权重值:
其中,SNRapriori(f,i)表示当前帧语音信号的先验信噪比,i表示帧索引,Thrsnr表示预定阈值。
6.如权利要求1所述的语音基音周期检测方法,其特征在于,根据相关性检测方法提取所述多帧语音信号中的多个基音候选项。
7.如权利要求5所述的语音基音周期检测方法,其特征在于,所述根据多个基音候选项和先验信噪比按照预设周期对所述多帧语音信号进行第一次动态规划以获得多个第一基音路径及所述第一基音路径对应的代价信息进一步包括:
获得所述多个基音候选项中每个基音候选项对应的权重值,所述权重值包括第一权重值和第二权重值,其中,所述第一权重值与所述基音候选项对应的先验信噪比相关,所述第二权重值与相关函数的峰值强度相关。
8.如权利要求7所述的语音基音周期检测方法,其特征在于,所述根据第一基音路径对应的代价信息对所述多个第一基音路径进行第二次动态规划以生成至少一个第二基音路径进一步包括:
对所述语音输入信号进行分段以生成多个语音段,其中,每个语音段包括多个第一基音路径;
根据代价信息对所述每个语音段中的多个第一基音路径进行排序;
选取所述每个语音段中前N个第一基音路径,N为正整数;以及
对多个语音段中每个语音段中选择的前N个第一基音路径进行第二次动态规划以生成至少一个第二基音路径。
9.如权利要求1所述的语音基音周期检测方法,其特征在于,还包括:
对所述至少一个第二基音路径进行平滑处理。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210592093.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:信号处理装置及其操作方法
- 下一篇:一种蕲蛇水溶性总蛋白冻干粉的制备方法