[发明专利]一种基音检测的方法和装置有效
| 申请号: | 201110170075.0 | 申请日: | 2011-06-22 |
| 公开(公告)号: | CN102842305A | 公开(公告)日: | 2012-12-26 |
| 发明(设计)人: | 齐峰岩;苗磊;阿里斯·塔勒布 | 申请(专利权)人: | 华为技术有限公司 |
| 主分类号: | G10L11/04 | 分类号: | G10L11/04;G10L11/00 |
| 代理公司: | 北京中博世达专利商标代理有限公司 11274 | 代理人: | 申健 |
| 地址: | 518129 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基音 检测 方法 装置 | ||
技术领域
本发明涉及一种基音检测的方法和装置,尤其涉及一种高精确度、运算复杂度较低的基音检测方法和装置。
背景技术
在数字通信领域,语音、图像、音频、视频的传输有着非常广泛的应用需求,如手机通话、音视频会议、广播电视、多媒体娱乐等。为了降低音视频信号存储或者传输过程中占用的资源,音视频压缩编码技术应运而生。在语音与音频信号处理中,基音检测是各种语音与音频实际应用中的关键技术之一,在语音编码,语音识别,音调检索中基音都是重要的提取参数,基音检测的准确性直接影响最后编码的性能。对于基音周期的检测,现有技术中,一般采用两种方法:
一种方法是时域法,通过对语音信号进行预处理后,在时域对输入信号进行分析和计算,确定基音周期。
因为语音信号在时域内对语音信号进行基音检测,大多采用的是相关函数法,只在时域内对语音信号的相关值进行检测,而语音信号在真正基音周期整数倍上的相关值都会很大,很难进行准确区分检测,容易出现基音周期加倍错误,从而降低了基音参数检测的精度。
另一种方法是频域法,是将时域信号转换到频域,并在频域上进行峰值检测;根据检测到的峰值和基音跟踪算法,得到基音频率;对该基音频率进行相应的转换,获得基音周期。
在此过程中,将时域信号转换到频域并在频域进行基音搜索的运算复杂度较高,在实际应用中很难被采用。
发明内容
本发明的实施例提供一种精确度高、运算复杂度较低的基音检测方法和装置。
为达到上述目的,本发明的实施例采用如下技术方案:
一种基音检测的方法,包括:
在时域对所述语音信号进行基音检测,得到初始基音周期;
将所述语音信号转换到频域,获得语音信号的频谱,该频谱包括频谱的幅度谱;
根据初始基音周期和所述语音信号的频谱提取特征参数;
根据初始基音周期和特征参数进行精细基音周期检测,得到精细基音周期。
一种基音检测的装置,包括:
初始基音周期获取模块:用于在时域对所述语音信号进行基音检测,得到初始基音周期;
时频转换模块:用于将所述语音信号转换到频域,获得语音信号的频谱,该频谱包括频谱的幅度谱;
特征参数提取模块:用于根据初始基音周期和所述语音信号的频谱提取特征参数;
精细基音周期获取模块:用于根据初始基音周期和特征参数进行精细基音周期检测,得到精细基音周期。
本发明实施例提供的一种基音检测的方法和装置,根据在时域上获取的初始基音周期和频域中所提取的特征参数对基音周期进行检测,避免基音周期加倍错误的出现,提高了基音周期检测的精确度。
附图说明
图1为本发明实施例一种基音检测的方法的流程图;
图2为为本发明实施例一种基音检测的方法语音信息加窗的结构示意图;
图3为本发明实施例一种基音检测的方法时频转换的流程图;
图4为本发明实施例一种基音检测的方法根据频点平均幅度与频点幅度的比值参数值和平均幅度参数值对三倍频进行倍频检测的流程图;
图5为本发明实施例一种基音检测的方法根据频点平均幅度与频点幅度的比值参数值和平均幅度参数值对二倍频进行倍频检测的流程图;
图6为本发明实施例一种基音检测的方法根据频点平均幅度与频点幅度的比值参数值和缓存数据对三倍频进行倍频检测的流程图;
图7为本发明实施例一种基音检测的方法根据频点平均幅度与频点幅度的比值参数值和缓存数据对二倍频进行倍频检测的流程图;
图8为本发明实施例一种基音检测的方法对幅度谱进行插值的流程图;
图9为本发明实施例一种基音检测的方法对语音信号进行补零的流程图;
图10为本发明实施例一种基音检测的方法对全频域进行检测的流程图。
图11为本发明实施例一种基音检测装置的结构示意图;
图12为本发明实施例2一种基音检测的装置时频转换模块的结构示意图;
图13为本发明实施例3一种基音检测的装置时频转换模块的结构示意图。
具体实施方式
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110170075.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:掩盖苦味的阿奇霉素颗粒
- 下一篇:开关识别方法、其装置及Z-wave控制终端





