[发明专利]个性化语音合成模型构建方法、装置、系统及电子设备在审
申请号: | 201911039684.5 | 申请日: | 2019-10-29 |
公开(公告)号: | CN112750423A | 公开(公告)日: | 2021-05-04 |
发明(设计)人: | 霍媛圆;雷鸣 | 申请(专利权)人: | 阿里巴巴集团控股有限公司 |
主分类号: | G10L13/04 | 分类号: | G10L13/04;G10L13/08;G10L25/78;G06F40/205;G06F40/106 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 钱秀茹 |
地址: | 英属开曼群岛大开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 个性化 语音 合成 模型 构建 方法 装置 系统 电子设备 | ||
本申请公开了个性化语音合成模型构建方法、装置和系统,个性化语音合成方法、装置和系统,以及电子设备。其中,模型构建方法包括:将录音文本分割为多个句子文本;在采集用户录音数据时,以第一显示方式显示当前阅读句子文本,以第二显示方式显示当前阅读句子文本后的文本信息;向服务端发送采集到的用户录音数据,以使得服务端根据所述用户录音数据,构建所述用户的个性化语音合成模型。采用这种处理方式,使得控制用户录音中句子与句子之间的停顿,避免在句子中间的非正常停顿,由此可确保用户录音质量,以便于从整段录音中获得较好的录音分句结果;因此,可以有效提升个性化语音合成模型的准确度,进而提升个性化语音合成的语音自然度和音色。
技术领域
本申请涉及数据处理技术领域,具体涉及个性化语音合成模型构建方法、装置及系统,个性化语音合成方法、装置及系统,以及电子设备。
背景技术
所谓个性化语音合成,就是通过身边的一些录音设备,录取某个人的某些语音片段后,让TTS(Text To Speech,文本到语音,语音合成)语音技术,合成出像某个特定人的说话语音,说话方式,和说话情感。
个性化语音合成技术,涉及到语音学方面许多现代发展起来的新技术,包括:语音频谱特征转换技术、韵律特征转换技术、个性化语音合成模型的构建技术、和个性化参数自适应技术等等。其中,个性化语音合成模型的构建技术是个性化语音合成技术的核心技术之一,该技术可采用多种方式实现技术。其中,一种方式是直接根据录音数据训练个性化语音合成模型,该方式具有简单易行的优点;另一方式是从由每句录音与句子间对应关系构成的训练数据中,学习得到个性化语音合成模型,该方式可以合成出自然度很高、音色很好的文本语音,因此成为目前常用的个性化语音合成模型的构建技术。
然而,在实现本发明过程中,发明人发现现有技术方案至少存在如下问题:由于无法从整段录音中获得较好的录音分句结果,因此无法得到质量较高的个性化语音合成模型,进而无法利用该模型合成出自然度很高、音色很好的文本语音。
发明内容
本申请提供个性化语音合成模型构建方法,以解决现有技术存在的个性化语音合成模型的准确度较低的问题。本申请另外提供个性化语音合成模型构建装置和系统,个性化语音合成方法、装置和系统,以及电子设备。
本申请提供一种个性化语音合成模型构建方法,包括:
将录音文本分割为多个句子文本;
在采集用户录音数据时,以第一显示方式显示当前阅读句子文本,以第二显示方式显示当前阅读句子文本后的文本信息;
向服务端发送采集到的用户录音数据,以使得服务端根据所述用户录音数据,构建所述用户的个性化语音合成模型。
可选的,所述第一显示方式包括:高亮显示方式;
所述第二显示方式包括:非高亮显示方式。
可选的,所述第一显示方式与所述第二显示方式具有不同的颜色、字体和/或字号。
可选的,所述第二显示方式包括:录音进度条方式,以便于用户根据录音进度条调整录音速度。
可选的,所述当前阅读句子文本后的文本信息包括:用户正在录制句子的序号,和/或未阅读句子的数量。
可选的,所述以第一显示方式显示当前阅读句子文本,包括:
根据所述当前阅读句子文本的文本长度,确定所述当前阅读句子文本的显示时长;
以第一显示方式,持续所述显示时长显示当前阅读句子文本。
可选的,所述根据所述当前阅读句子文本的文本长度,并确定所述当前阅读句子文本的显示时长,包括:
根据所述当前阅读句子文本的文本长度和字阅读时长,确定所述当前阅读句子文本的第一显示时长;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于阿里巴巴集团控股有限公司,未经阿里巴巴集团控股有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911039684.5/2.html,转载请声明来源钻瓜专利网。