[发明专利]基于卷积非负矩阵分解的语音转换方法无效

专利信息
申请号: 201110267425.5 申请日: 2011-09-09
公开(公告)号: CN102306492A 公开(公告)日: 2012-01-04
发明(设计)人: 张雄伟;孙健;曹铁勇;孙新建;黄建军;杨吉斌;邹霞;贾冲 申请(专利权)人: 中国人民解放军理工大学
主分类号: G10L15/06 分类号: G10L15/06;G10L19/02;G10L13/02
代理公司: 南京理工大学专利中心 32203 代理人: 唐代盛
地址: 210007 *** 国省代码: 江苏;32
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明公开了一种基于卷积非负矩阵分解的语音转换方法,通过训练数据对变换模型进行训练,首先训练语音数据的时间对准及参数分解,使用卷积非负矩阵分解方法对STRAIGHT谱进行分析,分析源语音与目标语音的基音频率;基于训练模型对新输入语音进行转换:对于待转换的源语音数据采用STRAIGHT模型进行参数分解,基于卷积非负矩阵分解实现声道频谱参数的转换,基于训练阶段得到的基音频率的均值和方差,实现基音频率的转换,合成转换后的语音,即通过转换得到的STRAIGHT谱、基音频率及原始非周期分量合成转换后的语音。本发明提升了语音转换的训练效果,改善了变换语音的语音质量。
搜索关键词: 基于 卷积 矩阵 分解 语音 转换 方法
【主权项】:
1.一种基于卷积非负矩阵分解的语音转换方法,其特征在于步骤如下:首先,通过训练数据对变换模型进行训练:第一步:训练语音数据的时间对准及参数分解,对于训练所用的平行语音数据,即源说话人和目标说话人的相同内容的语音对,其中源说话人语音可表示为,目标说话人语音可表示为,首先通过STRAIGHT模型提取两者的基音周期包络,之后通过基音周期包络及原始语音信号计算用于实现基音同步叠接相加处理的基音标注点;依照音素划分信息,以语音的对应音素为单位进行基音标注点匹配,之后再以音素为基本单元,基于匹配基音标注点采用基音同步叠接相加方式实现语音的时间对准,得到时间对准后的语音,使用STRAIGHT模型对进行分析,得到三组参数:(1)表征声道特性的STRAIGHT谱;(2)基音频率;(3)非周期分量;第二步:使用卷积非负矩阵分解方法对STRAIGHT谱进行分析,即首先对的STRAIGHT谱采用卷积非负矩阵分解方法分析,得到其时频基及编码矩阵,之后再通过卷积非负矩阵分解方式对的STRAIGHT谱进行分析,此时固定其编码矩阵为,则可得到其时频基;第三步:分析源语音与目标语音的基音频率,即通过对的基音频率信息进行分析,得到其两者的均值和方差:;其次,基于训练模型对新输入语音进行转换:第一步:对于待转换的源语音数据采用STRAIGHT模型进行参数分解,得到其STRAIGHT谱、基音频率及非周期分量三组参数;第二步:基于卷积非负矩阵分解实现声道频谱参数的转换,即对采用卷积非负矩阵分解进行分析,此时固定其时频基为,得到相应的编码矩阵,进而通过如下公式得到转换后的STRAIGHT谱:其中表示转换后的STRAIGHT谱,“”为卷积运算;第三步:基于训练阶段得到的基音频率的均值和方差,实现基音频率的转换:其中表示转换后的基音频率;第四步:合成转换后的语音,即通过转换得到的STRAIGHT谱、基音频率及原始非周期分量合成转换后的语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军理工大学,未经中国人民解放军理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201110267425.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top