[发明专利]一种语音合成模型的训练方法、装置、电子设备和存储介质在审
申请号: | 202010835266.3 | 申请日: | 2020-08-19 |
公开(公告)号: | CN111968616A | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 张鹏;胡新辉;徐欣康 | 申请(专利权)人: | 浙江同花顺智能科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/04 |
代理公司: | 北京锺维联合知识产权代理有限公司 11579 | 代理人: | 金爱静 |
地址: | 310023 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 语音 合成 模型 训练 方法 装置 电子设备 存储 介质 | ||
1.一种语音合成模型的训练方法,其特征在于,所述方法包括:
通过语音合成模型对语音文本进行处理,得到所述语音文本中的一条语音语句对应的语音;
基于所述语音的长度,判定所述语音语句是否正确结尾;
若判定所述语音语句没有正确结尾,则确定所述语音语句的正确结束位置;
将所述语音语句和所述语音语句的正确结束位置存储至异常训练库,基于所述异常训练库对所述语音合成模型进行局部训练,得到更新的语音合成模型。
2.根据权利要求1所述的方法,其特征在于,所述基于所述语音的长度,判定所述语音语句是否正确结尾,包括:
判断所述语音的长度是否大于或等于第一目标阈值;
若所述语音的长度大于或等于第一目标阈值,则判定所述语音语句没有正确结尾;
若所述语音的长度小于第一目标阈值,则判定所述语音语句正确结尾。
3.根据权利要求1所述的方法,其特征在于,所述确定所述语音语句的正确结束位置,包括:
对所述语音进行识别;
将所述语音的识别结果与所述语音语句所在的语音文本进行比较,基于比较结果确定所述语音语句的正确结束位置。
4.根据权利要求1至3中任一项所述的方法,其特征在于,所述基于所述异常训练库对所述语音合成模型进行局部训练,包括:
判断所述异常训练库中的语音语句的数量是否达到第二目标阈值;
若所述异常训练库中的语音语句的数量达到第二目标阈值,则基于所述异常训练库对所述语音合成模型进行局部训练。
5.根据权利要求1至3中任一项所述的方法,其特征在于,所述基于所述异常训练库对所述语音合成模型进行局部训练,包括:
判断目标时间距离当前时间的时长是否达到指定时长;
若所述目标时间距离当前时间的时长是否达到指定时长,则基于所述异常训练库对所述语音合成模型进行局部训练。
6.根据权利要求5所述的方法,其特征在于,
所述目标时间为所述语音合成模型对文本中的第一条语音语句进行处理的时间;或者,
所述目标时间为所述异常训练库首次更新的时间。
7.一种语音合成模型的训练装置,其特征在于,所述装置包括:
处理单元,用于通过语音合成模型对语音文本进行处理,得到所述语音文本中的一条语音语句对应的语音;
判断单元,用于基于所述语音的长度,判定所述语音语句是否正确结尾;
确定单元,用于若判定所述语音语句没有正确结尾,则确定所述语音语句的正确结束位置;
训练单元,用于将所述语音语句和所述语音语句的正确结束位置存储至异常训练库,基于所述异常训练库对所述语音合成模型进行局部训练,得到更新的语音合成模型。
8.根据权利要求7所述的装置,其特征在于,所述判断单元,具体用于判断所述语音的长度是否大于或等于第一目标阈值;若所述语音的长度大于或等于第一目标阈值,则判定所述语音语句没有正确结尾;若所述语音的长度小于第一目标阈值,则判定所述语音语句正确结尾。
9.根据权利要求7所述的装置,其特征在于,所述确定单元,具体用于对所述语音进行识别;将所述语音的识别结果与所述语音语句所在的语音文本进行比较,基于比较结果确定所述语音语句的正确结束位置。
10.根据权利要求7至9中任一项所述的装置,其特征在于,所述判断单元,还用于判断所述异常训练库中的语音语句的数量是否达到第二目标阈值;
所述训练单元,用于若所述异常训练库中的语音语句的数量达到第二目标阈值,则基于所述异常训练库对所述语音合成模型进行局部训练。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江同花顺智能科技有限公司,未经浙江同花顺智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010835266.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:采用电磁选针的电脑横机线圈下压装置及其工作方法
- 下一篇:一种锪孔定位装置