[发明专利]一种个性化歌唱语音的合成方法有效

申请号：	200810107114.0	申请日：	2008-07-17
公开（公告）号：	CN101308652A	公开（公告）日：	2008-11-19
发明（设计）人：	王玉平;江源;凌震华;胡国平;胡郁;刘庆峰;王仁华	申请（专利权）人：	安徽科大讯飞信息科技股份有限公司
主分类号：	G10L13/02	分类号：	G10L13/02;G10L13/04
代理公司：	合肥天明专利事务所	代理人：	袁由茂
地址：	230088安徽省合肥***	国省代码：	安徽;34
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种个性化歌唱语音合成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种个性化歌唱语音的合成方法，其特征在于包括以下步骤实现：

(1)在大规模标准语音数据库上，用隐马尔科夫模型对语音的线谱频率系数进行建模，并训练得到基于上下文相关属性集的线谱频率系数和声韵母时长的决策树模型；

(2)录制特定用户的少量朗读风格语音，并在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应，得到该用户的个性化的线谱频率系数模型；

(3)对文本化的简谱中的歌词，经过文本处理分析后，得到上下文相关的属性集，然后根据(1)训练得到的决策树模型和(2)得到个性化线谱频率系数模型预测出歌词对应的频谱参数和声韵母时长信息；

(4)根据简谱对于唱歌的音调、节拍的约定，生成基频信息，并对(3)中预测得到的时长信息进行调整；

(5)得到(4)生成的时长、基频与(3)中预测得到的频谱参数合并后，就生成了最后的参数；这些参数是既具有目标说话人特征，又具有歌唱特征的基频、时长和线谱频率参数，将这些参数输入参数化语音合成声码器，即可合成出个性化的歌唱语音。

2.根据权利要求1所述的一种个性化歌唱语音的合成方法，其特征在于所述的个性化的线谱频率系数模型，通过标准线谱频率系数模型自适应训练得到，而标准线谱频率系数通过在一个或多个大规模的标准语音库上训练得到。

3.根据权利要求1所述的一种个性化歌唱语音的合成方法，其特征在于在录音数据库上对线谱频率系数的隐马尔科夫模型进行自适应的语音录音所对应的文本是经过音素覆盖率搜索设计的文本。

4.根据权利要求1所述的一种个性化歌唱语音的合成方法，其特征在于所述的步骤(2)中自适应方法是基于最大似然的线性回归的模型自适应方法。

5.根据权利要求4所述的一种个性化歌唱语音的合成方法，其特征在于所述的基于最大似然的线性回归的模型自适应方法是根据最大似然准则估计一系列的线性变换，让这些变换抓住当前模型与目标模型之间的差异，对模型中所有的分布作调整。

6.根据权利要求1所述的一种个性化歌唱语音的合成方法，其特征在于所述的步骤(4)中对所述基频参数的预测为由曲谱信息直接赋值。

7.根据权利要求1所述的一种个性化歌唱语音的合成方法，其特征在于所述步骤(4)中时长信息的调整是按照曲谱给定的信息来进行时长调整。

8.根据权利要求7所述的一种个性化歌唱语音的合成方法，其特征在于所述时长信息的调整是采用按比例分配曲谱给定的信息来对时长进行调整。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于安徽科大讯飞信息科技股份有限公司，未经安徽科大讯飞信息科技股份有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/200810107114.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载