[发明专利]一种在声门闭相下估计声道面积的方法有效
申请号: | 201711206456.3 | 申请日: | 2017-11-27 |
公开(公告)号: | CN108133713B | 公开(公告)日: | 2020-10-02 |
发明(设计)人: | 陶智;孙宝印;邵雅婷;张晓俊;吴迪;肖仲喆 | 申请(专利权)人: | 苏州大学 |
主分类号: | G10L25/75 | 分类号: | G10L25/75;G10L25/12;G10L25/51;G10L25/60;G10L13/02 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱小兵 |
地址: | 215000 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 声门 闭相下 估计 声道 面积 方法 | ||
本发明公开了一种在声门闭相下声道面积的估计方法,首先采用DYPSA算法确定声门两个相邻闭合点位置,以相邻的两个闭合点为单位同步计算衰减的权重激励函数;接着利用加权线性预测方法计算声门闭相下声道模型的反射系数;然后迭代计算离散声道面积函数。从逆滤波角度验证本方法的优越性,选取六类声道面积特征进行识别分析,相比于用同一个语音库的特征融合优化算法实现了7%的准确率提升。
技术领域
本发明涉及线性预测法估计声道面积技术领域,尤其涉及一种在声门闭相下估计声道面积的方法。
背景技术
声道是语音生成过程中重要的系统之一,声道形状的研究能够应用于语音合成、语音识别、语言训练、音乐控制等。研究表明,发出相同的语音时,一些特殊嗓音(如:声带小结、声带息肉、甲亢嗓音)和正常嗓音对应的声道形状有所不同。X射线成像、超声成像、MRI(magnetic resonance imaging)磁共振成像等医学方法可以获得准确的声道面积,但是这些方法使受试者暴露于不同种类的射线和电磁波当中,对人体有潜在危害而且设备要求较高、操作复杂,不够灵活方便。间接估计声道形状的方法仅仅需要对语音数据进行处理,简单实用。目前估计声道面积主要有共振峰法和线性预测逆滤波法,其中采用线性预测逆滤波的方法涉及到对边界条件的假设。
线性预测法估计声道面积的研究中,存在两种不同的边界条件:声门完全闭合,即声门反射系数为1,声道损耗集中于唇端;唇端完全闭合,即唇端反射系数为1,声道损耗集中于声门处。
实际应用上述假设时,这两种均不能很好的满足,从而不利于声道面积函数的估计,如声门在发声时,有规律地开启和闭合,在频率非常低的条件下,唇端辐射阻抗可以被认为是0,则边界条件不能得到合理的结果;以及,某些元音(元音/a/等)的发音导致条件不符合实际情况。
Deng H提出在声门闭相下估计声道面积函数,但是其仅将声门闭相与声门波的幅值联系起来,他将声门波幅值在峰值的一半以下认为是声门闭相,这一估计方法并不严格准确,且导致用于自相关分析的数据量变得不足。
发明内容
本发明所要解决的技术问题是为了克服上述现有技术的缺点,本发明在声门闭相方法的基础上提出一种新的算法,以达到准确估计闭相下嗓音的声道面积。
本发明为解决上述技术问题采用以下技术方案
一种在声门闭相下估计声道面积的方法,具体包括如下步骤:
步骤1:确定声门的两个相邻闭合点位置GCI1和GCI2;
步骤2:根据声门的两个相邻闭合点位置GCI1和GCI2计算衰减的权重激励函数Wn,具体如下:
以声门的两个相邻闭合点位置GCI1和GCI2为一个周期,将两个相邻闭合点位置GCI1和GCI2附近的Wn设置为d,以GCI1为原点建立坐标,权重激励函数Wn以恒定斜率从d增加到1,以绝对值相同的斜率从1减小到d,此后直到GCI2的位置Wn变为d,权重激励函数Wn形成一个梯形分段函数,如下:
其中,d为小于1的正常数,n表示从原点开始的第n个语音数据点,N为一个周期内的所有数据点数,α、β为分段函数中不同分段所占的比例,N斜坡表示权重函数值从d上升到1所经过的点数;
步骤3:在加权线性预测均方误差最小的条件下计算声门闭相下声道的线性预测系数;
步骤4:迭代计算无损管道模型的离散声道面积函数:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于苏州大学,未经苏州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711206456.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种处理音频数据的方法和装置
- 下一篇:磁盘用玻璃基板