[发明专利]非常短的基音周期检测和编码有效
申请号: | 201710341997.0 | 申请日: | 2012-12-21 |
公开(公告)号: | CN107293311B | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 高扬;齐峰岩 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L25/90 | 分类号: | G10L25/90;G10L25/21;G10L25/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 非常 基音 周期 检测 编码 | ||
1.一种由语音或音频编码装置实施的非常短的基音周期检测和编码的方法,其特征在于,所述方法应用于处理单元,所述处理单元配备有一个或者多个输入/输出设备,所述处理单元包括处理器,所述方法由所述处理器执行,所述方法包括:
使用时域和频域基音周期检测技术的组合在语音或音频信号中检测比常规最小基音周期限制更短的非常短的基音周期,所述组合包括使用基音周期相关系数和检测缺少低频能量,其中,所述常规最小基音周期限制为码激励线性预测CELP算法中定义的最小基音周期限制;以及
对所述语音或音频信号在最小的非常短的基音周期限制到所述常规最小基音周期限制的范围内的所述非常短的基音周期进行编码,其中所述最小的非常短的基音周期限制是预定义的并且小于所述常规最小基音周期限制;
所述使用时域和频域基音周期检测技术的组合检测所述非常短的基音周期包括:
检测从零到预定义最小频率的第一频率区域中的所述语音或音频信号的第一能量以及从所述预定义最小频率到预定义最大频率的第二频率区域中的第二能量;以及
计算所述第一能量和所述第二能量之间的能量比;
使用平均标准化基音周期相关系数调整所述能量比,得到调整后的能量比;以及
使用所述调整后的能量比计算平滑能量比。
2.根据权利要求1所述的方法,其特征在于,使用时域和频域基音周期检测技术的组合检测非常短的基音周期包括:
使用候选基音周期和所述语音或音频信号的加权值计算标准化基音周期相关系数;和
使用所述标准化基音周期相关系数计算所述平均标准化基音周期相关系数。
3.根据权利要求2所述的方法,其特征在于,使用时域和频域基音周期检测技术的组合检测所述非常短的基音周期进一步包括:
计算最初非常短的基音周期的相关系数;以及
使用所述最初非常短的基音周期的所述相关系数计算平滑短基音周期相关系数。
4.根据权利要求3所述的方法,其特征在于,使用时域和频域技术的组合检测非常短的基音周期进一步包括根据所述平滑能量比和所述平滑短基音周期相关系数计算最终非常短的基音周期。
5.根据权利要求2所述的方法,其特征在于,所述使用时域和频域基音周期检测技术的组合在语音或音频信号中检测比常规最小基音周期限制更短的非常短的基音周期包括:
使用以下公式计算标准化基音周期相关系数:
其中R(P)是所述标准化基音周期相关系数,P是候选基音周期,以及sw(n)是所述语音信号的加权值。
6.根据权利要求1或5所述的方法,其特征在于,使用以下公式计算所述平均标准化基音周期相关系数:
Voicing=[R1(P1)+R2(P2)+R3(P3)+R4(P4)]/4,
其中Voicing是所述平均标准化基音周期相关系数,R1(P1)、R2(P2)、R3(P3)和R4(P4)是为所述语音或音频信号的帧的四个子帧计算的四个标准化基音周期相关系数,并且P1、P2、P3和P4是所述四个子帧的四个基音周期候选。
7.根据权利要求6所述的方法,其特征在于,所述使用时域和频域基音周期检测技术的组合在语音或音频信号中检测比常规最小基音周期限制更短的非常短的基音周期进一步包括:
使用以下公式计算平滑基音周期相关系数:
Voicing_sm=(3·Voicing_sm+Voicing)/4,
其中,等式左边的Voicing_sm为当前帧的平滑基音周期相关系数,等式右边的Voicing_sm为前一帧的平滑基音周期相关系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710341997.0/1.html,转载请声明来源钻瓜专利网。