[发明专利]一种基于声道滤波和声门激励的语音重构方法在审

申请号：	202111650490.6	申请日：	2021-12-29
公开（公告）号：	CN114974271A	公开（公告）日：	2022-08-30
发明（设计）人：	邵玉斌;段云;龙华;杜庆治;苏树盟;黄张衡;刘晶	申请（专利权）人：	昆明理工大学
主分类号：	G10L19/16	分类号：	G10L19/16;G10L25/24;G10L25/78
代理公司：	昆明明润知识产权代理事务所(普通合伙) 53215	代理人：	王鹏飞
地址：	650093 云***	国省代码：	云南;53
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于声道滤波声门激励语音方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于声道滤波和声门激励的语音重构方法，其特征在于：

Step1：标记音频话音特征起止点，根据检测音频在频域下短时能量的平坦程度，标记音频中的有话段和无话段位置信息，供提取基音频率使用；

Step2：提取音频的基音频率，根据倒谱法将声脉冲倒谱和声道响应倒谱分离，提取出音频每一帧的基音频率；

Step3：根据提取出的基音频率，构建模拟声脉的冲激响应；

Step4：在音频进行快速傅里叶变换和取对数谱之后，利用离散余弦变换恢复出倒谱数据，最终提取出能量集中的部分，作为模拟的声道响应，并作为重构语音的滤波器数据；

Step5：利用提取出的声脉冲激响应和声道响应重构出语音。

2.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法，其特征在于，Step1中，标记音频话音特征起止点具体为：通过将音频信号进行分帧和加窗处理后，通过检测音频在频域下短时能量的平坦程度标记处音频中的有话段和无话段位置信息，区分出音频中的有话段和无话段，提取结果以一组二维数组表示一段语音的端点位置信息，从而提取出音频话音的起止点。

3.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法，其特征在于，Step2具体为：通过信号的采样频率与其在倒谱后频率范围中的最大值所在的位置的商作为特征，提取结果以一组一维数组表示一段样本音频的基音频率。

4.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法，其特征在于，Step3具体为：通过Step2中提取的样本基音频率，经过插值和平滑和归一化后，将基音频率输入到压控振荡器中，输出一段75～300Hz范围内的振荡信号，将振荡信号转换为矩形波并延迟1个单位进行错位相减，得到所需的冲激信号，输出信号以一组一维数组表示样本音频模拟的声脉冲激响应。

5.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法，其特征在于，Step4具体为：对分帧后的原语音数据进行快速傅里叶变换和进行取对数操作，再提取一半的数据点进行离散余弦变换恢复出另外一半数据的相位部分，再进行快速傅里叶逆变换，提取口腔特征中能量最为集中的42个点作为FIR滤波器的参数，即模拟的声道响应。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于昆明理工大学，未经昆明理工大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202111650490.6/1.html，转载请声明来源钻瓜专利网。

上一篇：一种基于上下文信息和反向注意力的息肉图像分割方法
下一篇：一种妇产护理康复理疗带

同类专利

专利分类

G 物理

G10 乐器；声学
G10L 语音分析或合成；语音识别；音频分析或处理
G10L19-00 用于冗余度下降情形
G10L19-02 .利用频谱分析，例如变换声码器或子频带声码器
G10L19-04 .利用预测技术
G10L19-06 ..例如短期预测系数的频谱特征的确定或编码
G10L19-08 ..激励函数的确定或编码；长期预测参数的确定或编码
G10L19-14 ..不包括在G10L 19/06至G10L 19/12组中的零部件，例如增益编码、后置滤波设计或声码器结构

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于声道滤波和声门激励的语音重构方法在审

专利文献下载