[发明专利]人声增强方法、装置及设备有效
申请号: | 201810089567.9 | 申请日: | 2018-01-30 |
公开(公告)号: | CN110097888B | 公开(公告)日: | 2021-08-20 |
发明(设计)人: | 许丽净 | 申请(专利权)人: | 华为技术有限公司 |
主分类号: | G10L19/02 | 分类号: | G10L19/02;G10L19/26;G10L21/003;G10L25/21 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 董建姣;刘芳 |
地址: | 518129 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 人声 增强 方法 装置 设备 | ||
1.一种人声增强方法,其特征在于,包括:
对第一音频帧的频域信号进行初始音调分量检测、周期性分析和连续性分析;
若在所述频域信号中检测到音调分量,则在所述频域信号中确定音调分量所处的频带集合,所述音调分量用于表达人声,所述频带集合中包括N个频带,所述N为大于或等于1的正整数;
根据所述N个频带,确定N个增强滤波器;
通过所述N个增强滤波器,对所述频域信号进行增强处理,得到频域增强信号;
对所述第一音频帧的频域信号和所述频域增强信号进行混音,得到人声增强信号。
2.根据权利要求1所述的方法,其特征在于,所述对第一音频帧的频域信号进行初始音调分量检测、周期性分析和连续性分析,包括:
对所述频域信号进行初始音调分量检测;
若在所述频域信号中检测出M个第一频带处含有初始音调分量,所述初始音调分量所处的第一频带的功率密度谱在第一频带范围内为一个极大值,且所述初始音调分量所处的第一频带的功率密度谱与第二频带范围内的各频带对应的功率密度谱之差大于第一阈值,所述第一频带为所述第一频带范围的子集,所述第二频带范围为所述第一频带范围的子集,所述M为大于或等于1的整数;
对处于所述M个第一频带的初始音调分量进行周期性分析,确定出是否有第二频带处存在周期性音调分量,所述周期性音调分量用于表达人声;
对处于所述M个第一频带的初始音调分量中的非周期性音调分量进行连续性分析,确定出是否有第三频带处存在连续性音调分量,所述连续性音调分量用于表达人声,第一音频帧集合中的周期性音调分量与处于所述第三频带的初始音调分量呈连续性分布,其中,所述第一音频帧集合包括位于所述第一音频帧之前且与所述第一音频帧相邻的至少一个音频帧;
所述若在所述频域信号中检测到音调分量,则在所述频域信号中确定音调分量所处的频带集合,包括:
若在所述M个第一频带中检测出K个第二频带和L个第三频带,则确定所述频带集合包括所述K个第二频带和所述L个第三频带,所述K为大于或等于0的整数,所述L为大于或等于0的整数。
3.根据权利要求2所述的方法,其特征在于,所述对处于所述M个第一频带的初始音调分量进行周期性分析,包括:
若所述M个第一频带对应有等间隔分布的至少一组频带,所述至少一组频带包括第四频带、且所述第四频带对应的谐波匹配比小于第二阈值,则确定所述频域信号的所述第四频带处存在周期性音调分量,其中,一组频带中包括至少三个频带;
所述第四频带对应的谐波匹配比如下公式一:
其中,所述P(n)为所述第四频带,所述n用于指示所述第四频带为第n个第一频带,所述ΔP(n)为所述第四频带与对应的等间隔分布的频带之间的间隔值。
4.根据权利要求2所述的方法,其特征在于,所述对处于所述M个第一频带的初始音调分量中的非周期性音调分量进行连续性分析,包括:
在确定所述M个第一频带中的第五频带处具有初始音调分量、且不具有周期性音调分量时,确定位于所述第一音频帧集合中的初始音调分量的与第五频带处的初始音调分量的分布趋势;
根据所述分布趋势确定搜索范围;
若在第一音频帧集合的所述搜索范围内存在周期性音调分量,则确定所述第五频带处存在连续性音调分量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华为技术有限公司,未经华为技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810089567.9/1.html,转载请声明来源钻瓜专利网。