[发明专利]一种基于声道滤波和声门激励的语音重构方法在审
| 申请号: | 202111650490.6 | 申请日: | 2021-12-29 |
| 公开(公告)号: | CN114974271A | 公开(公告)日: | 2022-08-30 |
| 发明(设计)人: | 邵玉斌;段云;龙华;杜庆治;苏树盟;黄张衡;刘晶 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G10L19/16 | 分类号: | G10L19/16;G10L25/24;G10L25/78 |
| 代理公司: | 昆明明润知识产权代理事务所(普通合伙) 53215 | 代理人: | 王鹏飞 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 声道 滤波 声门 激励 语音 方法 | ||
1.一种基于声道滤波和声门激励的语音重构方法,其特征在于:
Step1:标记音频话音特征起止点,根据检测音频在频域下短时能量的平坦程度,标记音频中的有话段和无话段位置信息,供提取基音频率使用;
Step2:提取音频的基音频率,根据倒谱法将声脉冲倒谱和声道响应倒谱分离,提取出音频每一帧的基音频率;
Step3:根据提取出的基音频率,构建模拟声脉的冲激响应;
Step4:在音频进行快速傅里叶变换和取对数谱之后,利用离散余弦变换恢复出倒谱数据,最终提取出能量集中的部分,作为模拟的声道响应,并作为重构语音的滤波器数据;
Step5:利用提取出的声脉冲激响应和声道响应重构出语音。
2.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法,其特征在于,Step1中,标记音频话音特征起止点具体为:通过将音频信号进行分帧和加窗处理后,通过检测音频在频域下短时能量的平坦程度标记处音频中的有话段和无话段位置信息,区分出音频中的有话段和无话段,提取结果以一组二维数组表示一段语音的端点位置信息,从而提取出音频话音的起止点。
3.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法,其特征在于,Step2具体为:通过信号的采样频率与其在倒谱后频率范围中的最大值所在的位置的商作为特征,提取结果以一组一维数组表示一段样本音频的基音频率。
4.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法,其特征在于,Step3具体为:通过Step2中提取的样本基音频率,经过插值和平滑和归一化后,将基音频率输入到压控振荡器中,输出一段75~300Hz范围内的振荡信号,将振荡信号转换为矩形波并延迟1个单位进行错位相减,得到所需的冲激信号,输出信号以一组一维数组表示样本音频模拟的声脉冲激响应。
5.根据权利要求1所述的基于声道滤波和声门激励的语音重构方法,其特征在于,Step4具体为:对分帧后的原语音数据进行快速傅里叶变换和进行取对数操作,再提取一半的数据点进行离散余弦变换恢复出另外一半数据的相位部分,再进行快速傅里叶逆变换,提取口腔特征中能量最为集中的42个点作为FIR滤波器的参数,即模拟的声道响应。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111650490.6/1.html,转载请声明来源钻瓜专利网。





