[发明专利]基于HMM的双语(普通话-英语)TTS技术有效
申请号: | 201110291213.0 | 申请日: | 2008-08-19 |
公开(公告)号: | CN102360543A | 公开(公告)日: | 2012-02-22 |
发明(设计)人: | Y·钱;F·K-P·宋 | 申请(专利权)人: | 微软公司 |
主分类号: | G10L13/06 | 分类号: | G10L13/06 |
代理公司: | 上海专利商标事务所有限公司 31100 | 代理人: | 蔡悦;钱静芳 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 hmm 双语 普通话 英语 tts 技术 | ||
1.一种至少部分地由计算机实现的用于基于文本来生成语音的方法,所述方法包括:
构建第一语言专用决策树;
构建第二语言专用决策树;
将来自所述第一树的叶节点映射到所述第二树的叶节点;
接收所述第二语言的文本;以及
至少部分地基于将来自所述第一树的叶节点映射到所述第二树的叶节点来生成对应于所接收到的文本的所述第二语言的语音。
2.如权利要求1所述的方法,其特征在于,将来自所述第一树的叶节点映射到所述第二树的叶节点包括使用KLD技术。
3.如权利要求1所述的方法,其特征在于,还包括将来自所述第二树的叶节点映射到所述第一树的叶节点。
4.如权利要求1所述的方法,其特征在于,一个决策树的多个叶节点映射到另一决策树的单个叶节点。
5.如权利要求1所述的方法,其特征在于,所述第一语言包括普通话。
6.如权利要求1所述的方法,其特征在于,所述第一语言和所述第二语言包括英语和普通话。
7.如权利要求1所述的方法,其特征在于,所述生成语音在不使用以所述第二语言所提供的语音的情况下发生。
8.一种至少部分地由计算机实现的用于多语言TTS系统的方法,所述方法包括:
提供用于第一语言中的声音的HMM;
提供用于第二语言中的声音的HMM;
确定所述第一语言中的声音的线谱对;
确定所述第二语言中的声音的线谱对;
基于所述第一语言中的声音和所述第二语言中的声音的线谱对来计算KLD得分,其中所述KLD得分指示所述第一语言中的声音和所述第二语言中的声音之间的相似性/相异性;以及
构建多语言基于HMM的TTS系统,其中所述TTS系统包括基于KLD得分的共享声音。
9.如权利要求8所述的方法,其特征在于,所述第一语言中的声音包括音素并且其中,所述第二语言中的声音包括音素。
10.如权利要求8所述的方法,其特征在于,所述第一语言中的声音包括子音素并且其中,所述第二语言中的声音包括子音素。
11.如权利要求8所述的方法,其特征在于,所述第一语言中的声音包括复杂音素并且其中,所述第二语言中的声音包括两个或更多音素。
12.如权利要求8所述的方法,其特征在于,所述第一语言中的声音包括上下文相关声音。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软公司,未经微软公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110291213.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:双模触敏数字笔记本
- 下一篇:准各向同性三维预制件及其制造方法