[发明专利]一种基于声道滤波和声门激励的语音重构方法在审
| 申请号: | 202111650490.6 | 申请日: | 2021-12-29 |
| 公开(公告)号: | CN114974271A | 公开(公告)日: | 2022-08-30 |
| 发明(设计)人: | 邵玉斌;段云;龙华;杜庆治;苏树盟;黄张衡;刘晶 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G10L19/16 | 分类号: | G10L19/16;G10L25/24;G10L25/78 |
| 代理公司: | 昆明明润知识产权代理事务所(普通合伙) 53215 | 代理人: | 王鹏飞 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 声道 滤波 声门 激励 语音 方法 | ||
本发明涉及一种基于声道滤波和声门激励的语音重构方法,属于语言合成技术领域。本发明首先标记音频话音特征起止点,根据检测音频在频域下短时能量的平坦程度,标记音频中的有话段和无话段位置信息,供提取基音频率使用,再提取音频的基音频率,根据倒谱法将声脉冲倒谱和声道响应倒谱分离,提取出音频每一帧的基音频率,其次根据提取出的基音频率,构建模拟声脉的冲激响应,再在音频进行快速傅里叶变换和取对数谱之后,利用离散余弦变换恢复出倒谱数据,最终提取出能量集中的部分,作为模拟的声道响应,并作为重构语音的滤波器数据,最后利用提取出的声脉冲激响应和声道响应重构出语音。本发明在保证语音重构准确率的前提下提高了重构效率。
技术领域
本发明涉及一种基于声道滤波和声门激励的语音重构方法,属于语言合成技术领域。
背景技术
随着社会的不断进步,语音合成技术在人们的日常生活中应用广泛,其应用价值越来越受到重视。语音合成出的声音能否拟人化、情感化,影响着设备的人机交互体验。
语音合成技术主要可以分为三类:波形合成法、参数合成法和规则合成法。波形合成法主要是通过将所需合成的语音波形按照不同音素语音波形存储起来,需要时再从素材库中取出所需素材拼接合成后输出;参数合成法主要是提取出语音的参数,由参数变化合成出所需要的语音信号;规则合成法则是在系统中存储语音的声学参数、从音素组成音节、词句,控制音调、韵律、轻重等规则,合成出目标文字后,再利用规则将其转换成连续的声波。
参数合成法凭借素材语音库需求量小、提取参数方便、系统能适应的韵律特征范围较宽的优点,在近些年来发展迅速。但依然具有提取算法复杂,提取参数过多,合成出的语音情感平淡等缺点。
人类的语音发声是通过声门不断地张开与闭合,使声门处气流冲击声带产生振动,这些气流通过声道从而产生语音,在说话时声道也是在不断的变换中,因此能够听到不同的语音。本发明所提到的发声模型就是基于人的发音器官的特点和语音产生的原理,通过提取语音中说话人不同时刻的基音频率和声道参数特性,模拟发声中的声门激励和声道变化,重构出语音信号。
发明内容
本发明要解决的技术问题是提供一种基于声道滤波和声门激励的语音重构方法,用以解决传统的参数合成法提取算法复杂,提取参数过多的问题。
本发明的技术方案是:一种基于声道滤波和声门激励的语音重构方法,其特征在于:
Step1:标记音频话音特征起止点,根据检测音频在频域下短时能量的平坦程度,标记音频中的有话段和无话段位置信息,供提取基音频率使用。
所述标记音频话音特征起止点具体为:通过将音频信号进行分帧和加窗处理后,通过检测音频在频域下短时能量的平坦程度标记处音频中的有话段和无话段位置信息,区分出音频中的有话段和无话段,提取结果以一组二维数组表示一段语音的端点位置信息,从而提取出音频话音的起止点。
Step2:基音频率包含着音频中说话人的声学信息,提取音频的基音频率,根据倒谱法将声脉冲倒谱和声道响应倒谱分离,提取出音频每一帧的基音频率。
具体为,通过信号的采样频率与其在倒谱后频率范围中的最大值所在的位置的商作为特征,提取结果以一组一维数组表示一段样本音频的基音频率。
Step3:根据提取出的基音频率,构建模拟声脉的冲激响应;
具体为,通过Step2中提取的样本基音频率,经过插值和平滑和归一化后,将基音频率输入到压控振荡器中,输出一段75~300Hz范围内的振荡信号,将振荡信号转换为矩形波并延迟1个单位进行错位相减,得到所需的冲激信号,输出信号以一组一维数组表示样本音频模拟的声脉冲激响应。
Step4:根据离散余弦变换的特点,提取声道的特征响应,在音频进行快速傅里叶变换和取对数谱之后,利用离散余弦变换恢复出倒谱数据,最终提取出能量集中的部分,作为模拟的声道响应,并作为重构语音的滤波器数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111650490.6/2.html,转载请声明来源钻瓜专利网。





