[发明专利]基于卷积非负矩阵分解的语音转换方法无效
申请号: | 201110267425.5 | 申请日: | 2011-09-09 |
公开(公告)号: | CN102306492A | 公开(公告)日: | 2012-01-04 |
发明(设计)人: | 张雄伟;孙健;曹铁勇;孙新建;黄建军;杨吉斌;邹霞;贾冲 | 申请(专利权)人: | 中国人民解放军理工大学 |
主分类号: | G10L15/06 | 分类号: | G10L15/06;G10L19/02;G10L13/02 |
代理公司: | 南京理工大学专利中心 32203 | 代理人: | 唐代盛 |
地址: | 210007 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: |
本发明公开了一种基于卷积非负矩阵分解的语音转换方法,通过训练数据对变换模型进行训练,首先训练语音数据的时间对准及参数分解,使用卷积非负矩阵分解方法对STRAIGHT谱进行分析,分析源语音与目标语音的基音频率;基于训练模型对新输入语音进行转换:对于待转换的源语音数据 |
||
搜索关键词: | 基于 卷积 矩阵 分解 语音 转换 方法 | ||
【主权项】:
1.一种基于卷积非负矩阵分解的语音转换方法,其特征在于步骤如下:首先,通过训练数据对变换模型进行训练:第一步:训练语音数据的时间对准及参数分解,对于训练所用的平行语音数据,即源说话人和目标说话人的相同内容的语音对,其中源说话人语音可表示为
,目标说话人语音可表示为
,首先通过STRAIGHT模型提取两者的基音周期包络
和
,之后通过基音周期包络及原始语音信号计算用于实现基音同步叠接相加处理的基音标注点
和
;依照音素划分信息,以语音
、
的对应音素为单位进行基音标注点匹配,之后再以音素为基本单元,基于匹配基音标注点采用基音同步叠接相加方式实现语音
与
的时间对准,得到时间对准后的语音
和
,使用STRAIGHT模型对
和
进行分析,得到三组参数:(1)表征声道特性的STRAIGHT谱
、
;(2)基音频率
、
;(3)非周期分量
、
;第二步:使用卷积非负矩阵分解方法对STRAIGHT谱进行分析,即首先对
的STRAIGHT谱
采用卷积非负矩阵分解方法分析,得到其时频基
及编码矩阵
,之后再通过卷积非负矩阵分解方式对
的STRAIGHT谱
进行分析,此时固定其编码矩阵为
,则可得到其时频基
;第三步:分析源语音与目标语音的基音频率,即通过对
和
的基音频率信息
和
进行分析,得到其两者的均值和方差:
、
和
、
;其次,基于训练模型对新输入语音进行转换:第一步:对于待转换的源语音数据
采用STRAIGHT模型进行参数分解,得到其STRAIGHT谱
、基音频率
及非周期分量
三组参数;第二步:基于卷积非负矩阵分解实现声道频谱参数的转换,即对
采用卷积非负矩阵分解进行分析,此时固定其时频基为
,得到相应的编码矩阵
,进而通过如下公式得到转换后的STRAIGHT谱:
其中
表示转换后的STRAIGHT谱,“
”为卷积运算;第三步:基于训练阶段得到的基音频率的均值和方差,实现基音频率的转换:
其中
表示转换后的基音频率;第四步:合成转换后的语音,即通过转换得到的STRAIGHT谱
、基音频率
及原始非周期分量
合成转换后的语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军理工大学,未经中国人民解放军理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110267425.5/,转载请声明来源钻瓜专利网。