[发明专利]具有高感染力的TTS处理技术在审
申请号: | 201810551651.8 | 申请日: | 2018-05-31 |
公开(公告)号: | CN110634466A | 公开(公告)日: | 2019-12-31 |
发明(设计)人: | 刘诗慧;栾剑 | 申请(专利权)人: | 微软技术许可有限责任公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02 |
代理公司: | 11353 北京市惠诚律师事务所 | 代理人: | 杨娟;杨雪婷 |
地址: | 美国华*** | 国省代码: | 美国;US |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本文公开的具有高感染力的TTS处理技术,除了考虑语义学特征、语言学特征之外,还对训练文本中的各个句子赋予了句子ID以区分训练文本中的各个句子,这些句子ID也被作为训练特征,引入到机器学习模型训练的过程中,从而使得机器学习模型能够学习到句子声学编码随着句子的上下文的变化规律。在使用训练后的模型进行TTS处理时,能够在韵律、语气方面具有自然的变化的输出语音,增强TTS的感染力。利用本文提供的TTS处理技术,可以生成具有高感染力有声读物,以该TTS处理技术作为核心,可以构建出具有高感染力的有声读物的在线生成系统。 | ||
搜索关键词: | 句子 机器学习模型 训练文本 语言学特征 变化规律 声学编码 输出语音 训练特征 在线生成 构建 韵律 引入 赋予 学习 | ||
【主权项】:
1.一种方法,包括:/n对输入文本的各个句子进行文本特征提取,获取所述输入文本的各个句子的句子语义学编码和句子语言学特征;/n根据所述输入文本的各个句子的句子语义学编码,在句子声学编码字典中进行相似度匹配检索,获取与该句子语义学编码匹配的句子声学编码;所述句子声学编码字典包括多个由具有映射关系的句子语义学编码、句子ID以及句子声学编码构成的条目;/n将所述输入文本的各个句子的句子声学编码和句子语言学特征输入到声学模型中,获取所述输入文本的各个句子的句子声学特征参数。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于微软技术许可有限责任公司,未经微软技术许可有限责任公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810551651.8/,转载请声明来源钻瓜专利网。