[发明专利]低复杂度的浊音语音检测和基音估计有效
| 申请号: | 201780095971.0 | 申请日: | 2017-08-17 |
| 公开(公告)号: | CN111226278B | 公开(公告)日: | 2023-08-25 |
| 发明(设计)人: | S·格拉夫;T·赫比格;M·布克 | 申请(专利权)人: | 塞伦妮经营公司 |
| 主分类号: | G10L25/93 | 分类号: | G10L25/93;G10L21/0208;G10L21/0216;G10L25/18 |
| 代理公司: | 北京林达刘知识产权代理事务所(普通合伙) 11277 | 代理人: | 刘新宇 |
| 地址: | 美国麻*** | 国省代码: | 暂无信息 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 复杂度 浊音 语音 检测 基音 估计 | ||
公开了一种用于浊音语音检测和基音估计的低复杂度方法和设备,其能够对由诸如车内通信(ICC)系统等的需要低延时的应用给出的特殊约束进行处理。示例性实施例采用非常短的帧,该非常短的帧只能捕获音频信号中的浊音语音的单个激励脉冲。与基音周期相对应的、多个这种脉冲之间的距离可以通过评价非常短的帧的低分辨率谱之间的相位差来确定。示例性实施例可以基于相位差来直接在频域中进行基音估计,并通过避免变换到时域以进行基音估计来减少计算复杂度。在相位差被判断为大致呈线性的情况下,示例性实施例通过对音频信号应用语音增强来增强浊音语音的话音质量。
背景技术
语音增强的目的是诸如通过提高可能例如由于噪声而退化的语音信号的可理解度和/或整体感知质量来提高语音质量。各种音频信号处理方法旨在提高语音质量。这种音频信号处理方法可以被诸如移动电话、因特网语音协议(VoIP)、电话会议系统、语音识别或任何其它音频通信应用等的许多音频通信应用所采用。
发明内容
根据示例性实施例,用于音频通信系统中的话音质量增强的方法可以包括监视由音频通信系统捕获的包括浊音语音和噪声的音频信号中的浊音语音的存在。噪声的至少一部分可以处于与浊音语音相关联的频率处。监视可以包括计算目前短窗中的音频信号的目前音频样本和至少一个先前短窗中的音频信号的先前音频样本的相应频域表示之间的相位差。该方法可以包括判断在相应频域表示之间计算出的相位差在频率上是否大致呈线性。该方法可以包括通过判断为所计算出的相位差大致呈线性来检测浊音语音的存在,并且在检测到浊音语音的情况下,通过对音频信号应用语音增强来增强经由音频通信系统所通信的浊音语音的话音质量。
应当理解,在相应频域表示之间计算出的相位差可以以在整个频率范围内具有局部变化的方式在频率上大致呈线性。例如,所计算出的相位差以在直线(linear line)的上方和下方具有偏差的方式近似地遵循直线。如果(诸如以下关于图6和图7F进一步所公开地)相位差平均遵循直线,则可以认为所计算出的相位差大致呈线性。大致呈线性可被定义为相位在频率上的斜率的低方差。低方差可以对应于诸如+/-1%、+/-5%、+/-10%、或者对于给定环境条件在可接受裕度内一致的任何其它合适值等的方差。低方差的范围可以针对环境条件动态地改变。根据示例性实施例,低方差可以对应于阈值(诸如以下关于等式(13)所公开的阈值),并且可以被用来判断所计算出的相位差是否大致呈线性。
目前短窗和至少一个先前短窗可以具有如下的窗长度,该窗长度太短以致不能捕获音频信号中的浊音语音的周期性浊音激励脉冲信号的整周期的音频样本。
音频通信系统可以是车内通信(ICC)系统,并且窗长度可以被设置为减少ICC系统中的音频通信延时。
方法还可以包括基于检测到存在和所计算出的相位差来直接在频域中估计浊音语音的基音频率。
计算可以包括计算相应频域表示的归一化互谱的相邻频率之间的相位关系的在频率上的加权和、并且计算所计算出的加权和的均值。判断可以包括将所计算出的均值的幅度与表示线性度的阈值进行比较以判断所计算出的相位差是否大致呈线性。
均值可以是复数,并且在所计算出的相位差被判断为大致呈线性的情况下,方法还可以包括基于复数的角度来直接在频域中估计浊音语音的基音周期。
方法可以包括:将所计算出的均值与各自基于目前短窗和不同的先前短窗所计算出的其它均值进行比较;以及基于最高均值的角度来直接在频域中估计浊音语音的基音频率,最高均值是基于比较而从该均值和其它均值中选择的。
计算加权和可以包括:在浊音语音的频率范围中的频率处采用加权系数,并且在至少一个先前帧包括多个帧的情况下应用平滑常数。
方法还可以包括基于检测到存在来直接在频域中估计浊音语音的基音频率。计算可以包括计算相应频域表示的归一化互谱。估计可以包括计算所计算出的归一化互谱的斜率并且将所计算出的斜率转换为基音周期。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于塞伦妮经营公司,未经塞伦妮经营公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201780095971.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:摩擦摆线驱动器
- 下一篇:用于生产电光显示器的工艺





