[发明专利]模型管理和语音合成方法、装置和系统及存储介质在审
申请号: | 201910371127.7 | 申请日: | 2019-05-05 |
公开(公告)号: | CN110010120A | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 黄志强;李秀林;李世龙;潘华山 | 申请(专利权)人: | 标贝(深圳)科技有限公司 |
主分类号: | G10L13/02 | 分类号: | G10L13/02;G10L13/08;G10L15/06 |
代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
地址: | 518000 广东省深圳市福田区福田街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 声学模型 存储介质 模型管理 地址信息 语音合成 加载 用户请求信息 查找目标 存储文件 工作效率 接收用户 请求信息 用户操作 用户提供 用户体验 语音处理 语音系统 指示目标 有效地 出错 发音 场景 | ||
本发明的实施例提供了一种模型管理方法、装置和系统以及存储介质与一种语音合成方法、装置和系统以及存储介质。模型管理方法包括:步骤S110:接收用户请求信息,其中,用户请求信息包括用于指示目标声学模型的存储文件所在地址的地址信息;步骤S120:在声学模型池中查找目标声学模型;步骤S130:在未查找到目标声学模型的情况下,根据地址信息将目标声学模型加载到声学模型池中。上述方案可以实现声学模型的热加载,可以为用户提供极大的自由度。上述方案无需用户介入,可以减少用户操作,这有利于提高语音系统的工作效率,减少出错,同时可以有效地提升用户体验。上述方案可以很好地满足超大规模、超多发音人场景下的语音处理需求。
技术领域
本发明涉及语音技术领域,更具体地涉及一种模型管理方法、装置和系统以及存储介质与一种语音合成方法、装置和系统以及存储介质。
背景技术
语音技术,例如语音识别、语音合成等,在最近几年蓬勃发展。语音合成系统能够合成发音流畅、情感丰富、音质逼真的语音,合成效果越来越好,使用也越来越普及。
目前,随着语音合成技术的逐步发展,对大规模多发音人的语音合成系统的需求越来越强烈,但是现有的语音合成系统基本都只支持固定的若干个发音人的声学模型的应用。
在现有的语音合成技术中,通常需要训练至少一个发音人的声学模型,并利用训练的声学模型进行语音合成等操作。当用于实现语音合成功能的服务程序启动的时候,该程序会通过配置文件设定单个或多个少量的声学模型。如果用户想要使用新的声学模型的话,往往需要修改配置文件并重启服务,这种方式操作不便,效率低,易出错,用户体验比较差,同时也难以满足大规模多发音人的语音合成需求。
发明内容
考虑到上述问题而提出了本发明。本发明提供了一种模型管理方法、装置和系统以及存储介质与一种语音合成方法、装置和系统以及存储介质。
根据本发明一方面,提供了一种模型管理方法,包括:步骤S110:接收用户请求信息,其中,用户请求信息包括用于指示目标声学模型的存储文件所在地址的地址信息;步骤S120:在声学模型池中查找目标声学模型;步骤S130:在未查找到目标声学模型的情况下,根据地址信息将目标声学模型加载到声学模型池中。
示例性地,根据地址信息将目标声学模型加载到声学模型池中包括:在声学模型池中查找空槽位;如果空槽位存在,则根据地址信息将目标声学模型加载到空槽位之一;和/或如果空槽位不存在,则根据地址信息将目标声学模型加载到声学模型池中的预定槽位。
示例性地,在如果空槽位不存在,则将目标声学模型加载到声学模型池中的预定槽位之前,模型管理方法还包括:如果空槽位不存在,则在声学模型池中查找最近最少使用的声学模型,其中,预定槽位是最近最少使用的声学模型的槽位;从声学模型池中卸载最近最少使用的声学模型。
示例性地,在如果空槽位不存在,则将目标声学模型加载到声学模型池中的预定槽位之前,模型管理方法还包括:如果空槽位不存在,则在声学模型池中查找加载时间最早的声学模型,其中,预定槽位是加载时间最早的声学模型的槽位;从声学模型池中卸载加载时间最早的声学模型。
示例性地,在步骤S110之前,模型管理方法还包括:创建指定进程,其中,指定进程包括多个线程;以及将用户请求信息分配给多个线程中的当前空闲的指定线程;其中,步骤S110、步骤S120和步骤S130由指定线程执行。
示例性地,用户请求信息还包括目标声学模型的标识信息,指定进程具有对应的进程结构体,进程结构体包括用于指示每个声学模型在声学模型池中的槽位的查找表,指定线程具有对应的线程结构体,线程结构体包括用于识别指定进程的进程结构体句柄,步骤S120包括:由指定线程基于进程结构体句柄和目标声学模型的标识信息访问查找表,以在声学模型池中查找目标声学模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于标贝(深圳)科技有限公司,未经标贝(深圳)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910371127.7/2.html,转载请声明来源钻瓜专利网。