[发明专利]基音检测方法、装置、终端设备和介质有效
申请号: | 201910906963.0 | 申请日: | 2019-09-24 |
公开(公告)号: | CN110728990B | 公开(公告)日: | 2022-04-05 |
发明(设计)人: | 王少华;申厚拯 | 申请(专利权)人: | 维沃移动通信有限公司 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/60 |
代理公司: | 北京东方亿思知识产权代理有限责任公司 11258 | 代理人: | 彭琼 |
地址: | 523860 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基音 检测 方法 装置 终端设备 介质 | ||
本发明公开了一种基音检测方法、装置、终端设备和介质。该方法包括:获取时域上的待检测语音信号;确定待检测语音信号对应的目标频域信号;基于目标频域信号确定M个基音周期侯选值;基于M个余弦信号从M个基音周期候选值中确定待检测语音信号的基音周期;M个余弦信号是利用M个基音周期侯选值生成的,M个余弦信号的周期分别为M个基音周期侯选值,且一个余弦信号的周期对应一个基音周期侯选值,M为大于等于2的整数。根据本发明实施例,能够提高基音检测的准确性。
技术领域
本发明涉及信息处理技术领域,尤其涉及一种基音检测方法、装置、终端设备和介质。
背景技术
目前,语音识别以及语音唤醒得到了越来越广泛的应用。然而,在噪声或者强噪声环境下,语音识别率和语音唤醒率会显著下降。语音基音周期是语音信号的一个重要特征,所以获取准确的语音基音周期对语音识别或语音唤醒是有帮助的。
目前,如果背景噪声信号较大,语音的谐波结构(尤其是低频的谐波结构)被噪声覆盖,此时难以获得较为准确的基音周期,基音周期容易被错误的估计为二次谐波、高次谐波、1/2谐波或者干扰噪声的某个频率等。因此,在低信噪比情况下基音周期估计不准,即降低了基音检测的准确率。
发明内容
本发明实施例提供一种基音检测方法、装置、终端设备和介质,以解决基音检测的准确率较低的问题。
为了解决上述技术问题,本发明是这样实现的:一种基音检测方法,包括:
获取时域上的待检测语音信号;
确定待检测语音信号对应的目标频域信号;
基于目标频域信号确定M个基音周期侯选值;
基于M个余弦信号从M个基音周期候选值中确定待检测语音信号的基音周期;M个余弦信号是利用M个基音周期侯选值生成的,M个余弦信号的周期分别为M个基音周期侯选值,且一个余弦信号的周期对应一个基音周期侯选值,M为大于等于2的整数。
第一方面,本发明实施例提供一种基音检测装置,该装置包括:
语音信号获取模块,用于获取时域上的待检测语音信号;
目标频域信号确定模块,用于确定待检测语音信号对应的目标频域信号;
基音周期候选值确定模块,用于基于目标频域信号确定M个基音周期侯选值;
基音周期确定模块,用于基于M个余弦信号从M个基音周期候选值中确定待检测语音信号的基音周期;M个余弦信号是利用M个基音周期侯选值生成的,M个余弦信号的周期分别为M个基音周期侯选值,且一个余弦信号的周期对应一个基音周期侯选值,M为大于等于2的整数。
第二方面,本发明实施例提供一种终端设备,设备包括:处理器以及存储有计算机程序指令的存储器;
处理器执行计算机程序指令时实现如本发明实施例提供的基音检测方法。
第三方面,本发明实施例提供一种计算机存储介质,计算机存储介质上存储有计算机程序指令,计算机程序指令被处理器执行时实现如本发明实施例提供的基音检测方法。
在本发明实施例中,采用两级基音周期估计方法,第一级利用时域上的待检测语音信号对应的目标频域信号,确定M个基音周期侯选值;第二级采用分别以M个基音周期侯选值为周期的M个余弦信号,从M个基音周期候选值中选出最准确的基音周期,避免将基音频率估计为二倍频、高倍频或1/2倍频等,提高了基音检测的准确性。
附图说明
从下面结合附图对本发明的具体实施方式的描述中可以更好地理解本发明其中,相同或相似的附图标记表示相同或相似的特征。
图1为本发明一实施例提供的基音检测方法的流程示意图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于维沃移动通信有限公司,未经维沃移动通信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910906963.0/2.html,转载请声明来源钻瓜专利网。