[发明专利]基于高斯过程输出后滤波的语音转换方法在审
申请号: | 201611189592.1 | 申请日: | 2016-12-21 |
公开(公告)号: | CN106782599A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 徐宁;鲍静益;姚潇;汤一彬;蒋爱民;刘小峰 | 申请(专利权)人: | 河海大学常州校区 |
主分类号: | G10L25/03 | 分类号: | G10L25/03;G10L25/27 |
代理公司: | 南京纵横知识产权代理有限公司32224 | 代理人: | 董建林 |
地址: | 213022 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于高斯过程输出后滤波的语音转换方法,首先进行训练阶段,针对源和目标的平行数据,利用高斯过程建立源与目标之间的映射关系,然后在转换阶段,通过该映射关系得到目标预测特征参数,利用高斯过程对该输出值进行最大似然估计,并建立输出值的方差的高斯分布。再对最大似然估计和方差的高斯分布进行联合最优化,完成对高斯过程输出的后滤波得到目标参数值,实现高质量的语音转换效果。本发明充分考虑了语音信号特征参数过平滑的问题,构造高斯过程输出后滤波的联合优化函数,提高预测特征参数的准确性,实现说话人个性特征的高质量变换。 | ||
搜索关键词: | 基于 过程 输出 滤波 语音 转换 方法 | ||
【主权项】:
一种基于高斯过程输出后滤波的语音转换方法,其特征是,包括以下步骤:(1)采用语音分析模型对原始语音进行分析,得到原始语音的参数;(2)从分析得到的参数中提取与音素相关的特征参数集合;(3)对原始语音和目标语音的特征参数集合进行参数对齐操作;(4)将对齐的特征参数集合利用高斯过程进行训练得到原始语音与目标语音的映射关系;(5)输入待转换源语音的特征参数,通过步骤(4)得到的映射关系得到目标语音的特征参数预测值;(6)利用高斯过程对目标语音的特征参数预测值进行最大似然估计,并计算目标语音特征参数预测值的方差的高斯分布;(7)对最大似然估计结果和方差的高斯分布结果进行联合最优化,得到最佳目标语音特征参数预测值,最后用语音合成模型合成目标语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学常州校区,未经河海大学常州校区许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201611189592.1/,转载请声明来源钻瓜专利网。
- 上一篇:电视画面和外设声音同步控制方法和装置
- 下一篇:音频文件的评分方法及装置