[发明专利]低复杂度的浊音语音检测和基音估计有效
| 申请号: | 201780095971.0 | 申请日: | 2017-08-17 |
| 公开(公告)号: | CN111226278B | 公开(公告)日: | 2023-08-25 |
| 发明(设计)人: | S·格拉夫;T·赫比格;M·布克 | 申请(专利权)人: | 塞伦妮经营公司 |
| 主分类号: | G10L25/93 | 分类号: | G10L25/93;G10L21/0208;G10L21/0216;G10L25/18 |
| 代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
| 地址: | 美国麻*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 复杂度 浊音 语音 检测 基音 估计 | ||
1.一种用于音频通信系统中的话音质量增强的方法,所述方法包括:
监视由所述音频通信系统捕获的包括浊音语音和噪声的音频信号中的所述浊音语音的存在,所述噪声的至少一部分处于与所述浊音语音相关联的频率处,所述监视包括计算目前短窗中的音频信号的目前音频样本和至少一个先前短窗中的音频信号的先前音频样本的相应频域表示之间的相位差,其中,所述目前短窗和所述至少一个先前短窗具有如下的窗长度,所述窗长度太短以致不能捕获所述音频信号中的所述浊音语音的周期性浊音激励脉冲信号的整周期的音频样本;
判断在相应频域表示之间计算出的相位差在频率上是否呈线性;以及
通过判断为所计算出的相位差呈线性来检测所述浊音语音的存在,并且在检测到所述浊音语音的情况下,通过对所述音频信号应用语音增强来增强经由所述音频通信系统所通信的所述浊音语音的话音质量。
2.根据权利要求1所述的方法,其中,所述音频通信系统是车内通信系统即ICC系统,并且所述窗长度被设置为减少所述ICC系统中的音频通信延时。
3.根据权利要求1所述的方法,还包括:基于检测到存在和所计算出的相位差,直接在频域中估计所述浊音语音的基音频率。
4.根据权利要求1所述的方法,其中,所述计算包括:
计算相应频域表示的归一化互谱的相邻频率之间的相位关系的在频率上的加权和;
计算所计算出的加权和的均值;以及
其中,所述判断包括:将所计算出的均值的幅度与表示线性度的阈值进行比较,以判断所计算出的相位差是否呈线性。
5.根据权利要求4所述的方法,其中,所述均值是复数,并且在所计算出的相位差被判断为呈线性的情况下,所述方法还包括基于所述复数的角度来直接在频域中估计所述浊音语音的基音周期。
6.根据权利要求4所述的方法,还包括:
将所计算出的均值与各自基于目前短窗和不同的先前短窗所计算出的其它均值进行比较;以及
基于最高均值的角度来直接在频域中估计所述浊音语音的基音频率,所述最高均值是基于所述比较而从所述均值和其它均值中选择的。
7.根据权利要求4所述的方法,其中,计算所述加权和包括:在所述浊音语音的频率范围中的频率处采用加权系数,并且在至少一个先前帧包括多个帧的情况下应用平滑常数。
8.根据权利要求1所述的方法,还包括基于检测到存在来直接在频域中估计所述浊音语音的基音频率,其中:
所述计算包括计算相应频域表示的归一化互谱;以及
所述估计包括计算所计算出的归一化互谱的斜率并且将所计算出的斜率转换为基音周期。
9.根据权利要求1所述的方法,其中,所述方法还包括:
基于检测到存在和所计算出的相位差,直接在频域中估计所述浊音语音的基音频率;以及
基于未检测到存在而对所述音频信号应用衰减因子,其中,所述语音增强包括基于所估计的基音频率对所述浊音语音进行重构、使噪声跟踪无效、对所述音频信号应用自适应增益、或其组合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塞伦妮经营公司,未经塞伦妮经营公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780095971.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:摩擦摆线驱动器
- 下一篇:用于生产电光显示器的工艺





