[发明专利]一种说话人声音转换方法有效
申请号: | 201210528629.4 | 申请日: | 2012-12-11 |
公开(公告)号: | CN102982809A | 公开(公告)日: | 2013-03-20 |
发明(设计)人: | 陈凌辉;戴礼荣;凌震华 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G10L25/30 | 分类号: | G10L25/30 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 宋焰琴 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种说话人声音转换方法,包括训练阶段和转换阶段,训练阶段包括:从源说话人和目标说话人的训练语音信号中分别提取基频特征、说话人特征和内容特征;根据所述基频特征构建基频转换函数;根据所述说话人特征构建说话人转换函数。转换阶段包括:从源说话人的待转换语音信号中提取基频特征和频谱特征;使用训练阶段得到的基频转换函数和说话人转换函数对从所述待转换语音信号中提取出的基频特征和说话人特征进行转换,得到转换后的基频特征和说话人特征;根据所得到的转换后的基频特征、说话人特征和待转换语音信号中的内容特征合成目标说话人的语音。本发明易于实现且转换后的音质和相似度较高。 | ||
搜索关键词: | 一种 说话 人声 转换 方法 | ||
【主权项】:
一种说话人声音转换方法,用于把源说话人所说的话的语音信号进行转换,使转换后的语音听起来是不同于源说话人的目标说话人所说的,其特征在于,该方法包括训练阶段和转换阶段,其中,所述训练阶段包括:步骤A1、从源说话人和目标说话人的训练语音信号中分别提取基频特征和频谱特征,所述频谱特征包括说话人特征和内容特征;步骤A2、根据源说话人和目标说话人的训练语音信号的基频特征,构建从源说话人的语音到目标说话人的语音的基频转换函数;步骤A3、根据步骤A1提取的源说话人和目标说话人的说话人特征构建说话人转换函数;所述转换阶段包括:步骤B1、从源说话人的待转换语音信号中提取基频特征和频谱特征,所述频谱特征包括说话人特征和内容特征;步骤B2、分别使用训练阶段得到的基频转换函数和说话人转换函数,对从步骤B1中从所述待转换语音信号中提取出的基频特征和说话人特征进行转换,得到转换后的基频特征和说话人特征;步骤B3、根据步骤B2得到的转换后的基频特征和说话人特征,以及步骤B1提取的待转换语音信号中的内容特征,合成目标说话人的语音。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210528629.4/,转载请声明来源钻瓜专利网。
- 上一篇:泄油过滤系统及工程机械
- 下一篇:一种气动式可多位置变距式结构