[发明专利]一种基于LPC及RBF神经网络的声音转换的方法无效
申请号: | 201210229540.8 | 申请日: | 2012-07-04 |
公开(公告)号: | CN102737628A | 公开(公告)日: | 2012-10-17 |
发明(设计)人: | 张钦宇;潘振鹏;林威;王喆;付东松;张勇勇;黄立伟 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L13/00;G10L21/02 |
代理公司: | 深圳市科吉华烽知识产权事务所 44248 | 代理人: | 胡吉科 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lpc rbf 神经网络 声音 转换 方法 | ||
1.一种基于LPC及RBF神经网络的声音转换的方法,其特征在于:包括以下步骤:
A、对语音进行预处理;
B、对浊音帧进行基频检测;
C、对基频检测后的浊音帧进行转换;
D、对转换后的基频进行浊音帧参量的提取;
E、对提取到的浊音帧参量进行计算,求得一帧浊音帧,然后对该一帧浊音帧进行合成,得到转换后的浊音帧。
2.根据权利要求1所述的基于LPC及RBF神经网络的声音转换的方法,其特征在于:所述A步骤还包括以下分步骤:
A1:从待转换语音中进行分帧;
A2: 运用判断方法对该帧进行清音和浊音的判断。
3.据权利要求2所述的基于LPC及RBF神经网络的声音转换的方法,其特征在于:所述A2步骤中,所述判断方法包括帧能量和帧过零率,帧能量的计算公式如下:
其中:x(m)为帧中第m个语音点的值,N为该帧的点数,E为帧能量, Ta为此函数的定义域m的阀值;
帧过零率的计算公式为:
其中:z为帧过零率,Tb为此函数的定义域m的阀值;计算出每帧的能量和过零率。
4. 根据权利要求1所述的基于LPC及RBF神经网络的声音转换的方法,其特征在于:所述B步骤中,对浊音帧进行基频检测是运用平均幅度差函数AMDF来检测的,其计算公式为:
其中:l为偏移量。
5.根据权利要求1所述的基于LPC及RBF神经网络的声音转换的方法,其特征在于:所述C步骤中, 对基频检测后的浊音帧进行转换,转换规则采用基频转换规则。
6.根据权利要求1所述的基于LPC及RBF神经网络的声音转换的方法,其特征在于:所述D步骤中,对浊音帧进行参量的提取,是用自相关法从最低价线性预测器开始,由低阶到高阶进行逐阶递推计算,求得浊音帧第P阶LPC系数,根据该浊音帧LPC系数求得该浊音帧LSF系数。
7.根据权利要求1至6任一项所述的基于LPC及RBF神经网络的声音转换的方法,其特征在于: 对源说话者与目标说话者的多个相同训练语音的浊音帧,分别提取出多组相对应LSF系数,获得转换后的LSF系数,再求得转换后的LPC系数。
8.根据权利要求7所述的,其特征在于:在求解所述转换后LPC系数的过程中求得预测误差能量Ep。
9.根据权利要求8所述的基于LPC及RBF神经网络的声音转换的方法,其特征在于:用所述预测误差能量Ep进行开方,得到增益G。
10.根据权利要求9所述的基于LPC及RBF神经网络的声音转换的方法,其特征在于:根据所述转换后的LPC系数、所述增益G,对一帧浊音帧进行合成,计算公式如下:
式中t(m)为一串冲激,周期为该帧的基频,转换后的LPC系数阶数为p,系数值为,增益为G,m为帧中第m个语音点,合成得到的语音为y(m),得到转换后的浊音帧,将所述转换后的浊音帧和所述的清音帧进行拼接合成,得到转换后的语音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210229540.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:控制非法使用应用软件的方法
- 下一篇:一种单元幕墙上横梁