[发明专利]韵律自适应及语音合成的方法和装置无效
申请号: | 200710197104.6 | 申请日: | 2007-12-04 |
公开(公告)号: | CN101452699A | 公开(公告)日: | 2009-06-10 |
发明(设计)人: | 易立夫;李健;楼晓雁;郝杰 | 申请(专利权)人: | 株式会社东芝 |
主分类号: | G10L13/08 | 分类号: | G10L13/08 |
代理公司: | 北京市中咨律师事务所 | 代理人: | 李 峥;刘 薇 |
地址: | 日本*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 韵律 自适应 语音 合成 方法 装置 | ||
1.一种数据驱动训练差分韵律自适应模型的方法,包括:
用时长和基频的正交多项式的系数表示差分韵律向量;
对于上述差分韵律向量中的每一个参数,
利用与差分韵律预测相关的多个属性和至少一部分上述属性的组合生成一个初始参数预测模型,其中每个上述属性或上述属性的组合被作为一项;
计算上述参数预测模型的每一上述项的重要性;
删除上述计算出的重要性最低的项;
利用剩余的项重新生成参数预测模型;
判断上述重新生成的参数预测模型是否最优;以及
如果上述参数预测模型被判断为不是最优,则重复上述计算每一项的重要性的步骤、上述删除重要性最低的项的步骤、上述重新生成参数预测模型的步骤和上述判断上述重新生成的参数预测模型是否最优的步骤;
其中,上述差分韵律向量及其全部参数预测模型构成差分韵律自适应模型。
2.根据权利要求1所述的数据驱动训练差分韵律自适应模型的方法,其中,上述与差分韵律预测相关的多个属性包括:语言类型、语音类型和情感/表情类型的属性。
3.根据权利要求1所述的数据驱动训练差分韵律自适应模型的方法,其中,上述与差分韵律预测相关的多个属性包括:从情感/表情状态、中文字在句子中的位置、声调和句子类型中选择的任意多个属性。
4.根据权利要求1至3任意一项所述的数据驱动训练差分韵律自适应模型的方法,其中,上述参数预测模型是广义线性模型。
5.根据权利要求1所述的数据驱动训练差分韵律自适应模型的方法,其中,上述至少一部分上述属性的组合包括上述多个与差分韵律预测相关的属性的全部2阶的属性组合。
6.根据权利要求1至5任意一项所述的数据驱动训练差分韵律自适应模型的方法,其中,上述计算上述参数预测模型中每一上述项的重要性的步骤包括:利用F检验计算每一项的重要性。
7.根据权利要求1至6任意一项所述的数据驱动训练差分韵律自适应模型的方法,其中,上述判断上述重新生成的参数预测模型是否最优的步骤包括:利用贝叶斯信息准则判断上述重新生成的参数预测模型是否最优。
8.根据权利要求7所述的数据驱动训练差分韵律自适应模型的方法,其中,上述判断上述重新生成的参数预测模型是否最优的步骤包括:
计算下式
BIC=Nlog(SSE/N)+plogN
其中,SSE表示预测误差e的平方和,N表示训练样本数;以及
当上式中的BIC最小时,判断参数预测模型为最优。
9.根据权利要求1至8任意一项所述的数据驱动训练差分韵律自适应模型的方法,其中,上述基频的正交多项式是二阶或更高阶的勒让德正交多项式。
10.根据权利要求9所述的数据驱动训练差分韵律自适应模型的方法,其中,上述勒让德正交多项式表示为:
F(t)=a0p0(t)+a1p1(t)+a2p2(t)
其中,F(t)表示基频的包络,a0、a1和a2表示所述系数,t属于[-1,1]。
11.一种生成差分韵律自适应模型的方法,包括:
形成差分韵律向量的训练样本集合;以及
根据上述差分韵律向量的训练样本集合,利用权利要求1至10任意一项所述的数据驱动训练差分韵律自适应模型的方法,生成差分韵律自适应模型。
12.根据权利要求11所述的生成差分韵律自适应模型的方法,其中,上述形成差分韵律向量的训练样本集合的步骤包括:
根据中性语料库,获取用时长和基频的正交多项式的系数表示的中性韵律向量;
根据情感/表情语料库,获取用时长和基频的正交多项式的系数表示的情感/表情韵律向量;以及
计算上述情感/表情韵律向量与上述中性韵律向量之间的差,以形成差分韵律向量的训练样本集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于株式会社东芝,未经株式会社东芝许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/200710197104.6/1.html,转载请声明来源钻瓜专利网。