[发明专利]基于信号时序特征建模的高质量语音转换方法有效
| 申请号: | 201210490464.6 | 申请日: | 2012-11-27 |
| 公开(公告)号: | CN103035236A | 公开(公告)日: | 2013-04-10 |
| 发明(设计)人: | 徐宁;鲍静益;汤一彬 | 申请(专利权)人: | 河海大学常州校区 |
| 主分类号: | G10L15/02 | 分类号: | G10L15/02;G10L15/06;G10L25/03 |
| 代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
| 地址: | 213022 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于信号时序特征建模的高质量语音转换方法,针对源和目标的平行数据,考虑对其时序特征进行建模和跟踪,利用混合式卡尔曼滤波器,并在期望最大化准则下估计模型结构参数,最终利用该模型映射语音的特征参数集合,实现高质量的语音转换效果。本发明提供的基于信号时序特征的高质量语音转换方法,充分利用了语音信号参数间的强烈相关性,通过模拟参数随时间变化的物理过程,构造了一种新型的混合式卡尔曼滤波器,并将其用于语音转换的参数映射过程,设计了一套特殊的、将卡尔曼滤波器参数与语音信号物理属性相关联的转换算法,实现说话人个性特征的变换。 | ||
| 搜索关键词: | 基于 信号 时序 特征 建模 质量 语音 转换 方法 | ||
【主权项】:
基于信号时序特征建模的高质量语音转换方法,其特征在于:针对源和目标的平行数据,考虑对其时序特征进行建模和跟踪,利用混合式卡尔曼滤波器,并在期望最大化准则下估计模型结构参数,最终利用该模型映射语音的特征参数集合,实现高质量的语音转换效果;具体包括如下步骤:(1)采用语音分析模型对原始语音信号进行分析;(2)从分析得到的参数中提取与音素相关的特征参数集合;(3)对源和目标的特征参数集合进行归一化操作,实现参数集合的对齐;(4)将对齐的参数集合分别用作混合式卡尔曼滤波器的输入和输出,实现模型参数的训练和估计;(5)将训练好的卡尔曼滤波器看作通用的泛函映射函数,基于特征参数映射方法映射任意的语音信号参数;(6)对转换后的特征参数进行反变换操作,即进行参数内插和相位补偿,最后用语音合成模型合成为高质量的语音;上述步骤中,步骤(1)~(4)为训练步骤,步骤(5)~(6)为转换步骤;所述混合式卡尔曼滤波器的结构为在经典的卡尔曼滤波器结构上新增一个隐层,所述隐层用于描述时序信号状态之间的渐变效果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210490464.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种气动夹紧及电动裁切结合的胶管裁切机
- 下一篇:一种圆弧切割辅助尺





