[发明专利]一种基于LPC及RBF神经网络的声音转换的方法无效
申请号: | 201210229540.8 | 申请日: | 2012-07-04 |
公开(公告)号: | CN102737628A | 公开(公告)日: | 2012-10-17 |
发明(设计)人: | 张钦宇;潘振鹏;林威;王喆;付东松;张勇勇;黄立伟 | 申请(专利权)人: | 哈尔滨工业大学深圳研究生院 |
主分类号: | G10L11/00 | 分类号: | G10L11/00;G10L13/00;G10L21/02 |
代理公司: | 深圳市科吉华烽知识产权事务所 44248 | 代理人: | 胡吉科 |
地址: | 518000 广东省深*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lpc rbf 神经网络 声音 转换 方法 | ||
技术领域
本发明涉及语音信号处理领域,尤其涉及一种基于LPC及RBF神经网络的声音转换的方法。
背景技术
对语音信号的处理,主要有三种方案:
1、基于矢量量化的码本映射技术实现方案
用矢量量化算法将源说话人和目标说话人的声学特征空间进行划分,用动态时间规整算法将源-目标特征矢量相关联,从而训练出一个源到目标说话人的映射码本。缺陷:尽管计算量较低,但是由于矢量量化作用造成的频谱的不连续性,转换语音质量还很低。
2、基于线性多变量回归的局部函数转换技术实现方案
说话人语音频谱空间由矢量量化划分成许多不同的子空间,每一个空间都训练一个局部函数,每个局部函数都表述了某一个声学空间源-目标说话人特征之间的关系,这样码本映射方案中的全局映射就被这些局部函数来近似。缺陷:这种局部空间转换的方法可以产生无穷多目标特征量。然而由于选择单个局部转换函数的离散性还存在,不连贯性仍然出现在输出语音中。
3、基于高斯混合模型的联合概率分布技术实现方案
通过概率的方法,采用高斯混合模型描述源-目标特征的联合概率分布,寻找转换函数来预测目标语音特征。这种技术比码本映射和局部函数变换有效性、鲁棒性也较好,理论上能使回归问题的混合成分得到更合理的配置。缺陷:这种技术在进行运算时计算量较大,而且存在转换语音频谱过分光滑现象,影响了转换语音目标说话人特征的倾向性。
发明内容
本发明解决的技术问题是:在已有的语音转换技术方案中,要么转换语音质量较低,要么计算量过大,本发明设计出一种高质量、计算量适中的语音转换技术方案。
本发明解决现有技术中存在的问题所采用的技术方案为:提供一种基于LPC及RBF神经网络的声音转换的方法,所述方法包括以下步骤:
A、对语音进行预处理;
B、对浊音帧进行基频检测;
C、对基频检测后的浊音帧进行转换;
D、对转换后的基频进行浊音帧参量的提取;
E、对提取到的浊音帧参量进行计算,求得一帧浊音帧,然后对该一帧浊音帧进行合成,得到转换后的浊音帧。
本发明的进一步技术方案是:所述A步骤还包括以下分步骤:
A1:从待转换语音中进行分帧;
A2: 运用判断方法对该帧进行清音和浊音的判断。
本发明的进一步技术方案是:所述A2步骤中,所述判断方法包括帧能量和帧过零率,帧能量的计算公式如下:
其中:x(m)为帧中第m个语音点的值,N为该帧的点数,E为帧能量, Ta为此函数的定义域m的阀值;
帧过零率的计算公式为:
其中:z为帧过零率,Tb为此函数的定义域m的阀值;计算出每帧的能量和过零率。通过此公式计算出每帧的能量和过零率,若帧能量大于一定的阀值Ta且过零率小于一定的阀值Tb,判定为浊音帧;否则,判定为清音帧。例如,假设Ta为语音的最大帧能量的10%,Tb约为120。当某一帧的能量大于Ta,过零率小于Tb时,判别为浊音帧,否则,为清音帧。由于语音信号具有清音部分能量低、浊音部分能量高,清音部分过零率高、浊音部分过零率低的特点。
本发明的进一步技术方案是:所述B步骤中,对浊音帧进行基频检测是运用平均幅度差函数AMDF来检测的,其计算公式为:
其中: l为偏移量。为避免偏移量过小,l的最小取值可设为10,最大取值原则上不超过该帧的点数的一半,可设为N/2;当l等于基频整数倍时,其平均幅度差函数AMDF值r(l)将达到极小值,尤其是当l等于基频时,取得最小值;因此,通过求得l的最小值,从而检测基频。
本发明的进一步技术方案是:所述D步骤中,对浊音帧进行参量的提取,是用自相关法从最低价线性预测器开始,由低阶到高阶进行逐阶递推计算,求得浊音帧第P阶LPC系数,根据该浊音帧LPC系数求得该浊音帧LSF系数。
本发明的进一步技术方案是:对源说话者与目标说话者的多个相同训练语音的浊音帧,分别提取出多组相对应LSF系数,获得转换后的LSF系数,再求得转换后的LPC系数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学深圳研究生院,未经哈尔滨工业大学深圳研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210229540.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:控制非法使用应用软件的方法
- 下一篇:一种单元幕墙上横梁