[发明专利]文本分析与语音合成方法、装置、系统及存储介质在审
| 申请号: | 202110787732.X | 申请日: | 2021-07-13 |
| 公开(公告)号: | CN113539235A | 公开(公告)日: | 2021-10-22 |
| 发明(设计)人: | 潘华山;李秀林 | 申请(专利权)人: | 标贝(北京)科技有限公司 |
| 主分类号: | G10L13/08 | 分类号: | G10L13/08;G10L13/047;G10L13/033;G10L25/30 |
| 代理公司: | 北京睿邦知识产权代理事务所(普通合伙) 11481 | 代理人: | 徐丁峰;戴亚南 |
| 地址: | 100192 北京市海淀区西小口路6*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 文本 分析 语音 合成 方法 装置 系统 存储 介质 | ||
本发明提供一种文本分析与语音合成方法、装置、系统及存储介质。方法包括:获取待处理文本;对待处理文本进行人名识别,以确定待处理文本中出现的所有人名;将所有人名中属于同一角色的人名聚类在一起,以获得与至少一个角色一一对应的至少一个人名集合;至少基于至少一个人名集合确定全局角色信息,全局角色信息包括与至少一个角色一一对应的至少一组角色信息,每组角色信息包括对应角色的代表性角色名称和别名集合;结合全局角色信息对待处理文本中的任一目标语句进行文本分析,文本分析包括对至少一个预设项目的分析,至少一个预设项目包括以下一项或多项:文本类型、角色名称和角色属性。利用全局角色信息辅助识别局部的角色信息。
技术领域
本发明涉及语音处理技术领域,具体地,涉及一种文本分析方法、装置、系统及存储介质与一种语音合成方法、装置、系统及存储介质。
背景技术
语音合成技术是一种将文字信息转化为声音信息的技术。语音合成技术可以为广大用户及目标应用提供语音合成服务。语音合成系统在如今有着较为广泛的应用。随着用户对有声读物类资源的需求日益增长,依靠人工录制有声读物语料的做法已难以满足需求,因而开发多角色多情绪的(半)自动语音合成技术/工具/系统显得尤为重要。
多角色多情绪的语音合成系统中,首先需要对待合成的文本进行文本分析,获得该文本中各对白(及独白)语句所对应的角色名称、角色属性、情绪类别等信息。随后,通过分析出的角色各种信息找出与该角色匹配的语音合成模型,以进一步通过该模型进行语音合成。
在现有技术中,上文所述的文本分析通常是基于目标语句及其上下文进行的局部分析,这种局部分析仅能获得局部的角色信息。然而,角色名称、性别、年龄等信息通常在大范围(或全局范围)内都处于稳定状态,上述局部分析的方法难以将大范围的角色信息关联起来,不利于对同一角色的识别和关联。此外,局部信息包含的信息内容不够丰富,很多时候仅通过局部信息很难识别角色的一些属性信息,例如性别等。
发明内容
为了至少部分地解决现有技术中存在的问题,提供一种文本分析方法、装置、系统及存储介质与一种语音合成方法、装置、系统及存储介质。
根据本发明一个方面,提供一种文本分析方法,包括:获取待处理文本;对所述待处理文本进行人名识别,以确定所述待处理文本中出现的所有人名;将所述所有人名中属于同一角色的人名聚类在一起,以获得与至少一个角色一一对应的至少一个人名集合;至少基于所述至少一个人名集合确定全局角色信息,其中,所述全局角色信息包括与所述至少一个角色一一对应的至少一组角色信息,每组角色信息包括对应角色的代表性角色名称和别名集合,所述别名集合包括对应角色的人名集合中除代表性角色名称以外的人名;结合所述全局角色信息对所述待处理文本中的任一目标语句进行文本分析,以获得所述目标语句所对应的文本分析结果,所述文本分析包括对至少一个预设项目的分析,所述至少一个预设项目包括以下一项或多项:文本类型、角色名称和角色属性,其中,对所述文本类型的分析是指判断所述目标语句是否属于多角色类型,所述多角色类型包括对白,所述角色属性包括角色性别和/或角色年龄。
根据本发明另一方面,还提供一种文本分析系统,包括处理器和存储器,其中,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器运行时用于执行上述文本分析方法。
根据本发明另一方面,还提供一种存储介质,在所述存储介质上存储了程序指令,所述程序指令在运行时用于执行上述文本分析方法。
根据本发明另一方面,还提供一种语音合成方法,包括上述文本分析方法,其中,语音合成方法还包括:至少基于文本分析结果对目标语句进行语音合成,以获得与目标语句相对应的合成语音。
根据本发明另一方面,还提供一种语音合成系统,包括处理器和存储器,其中,所述存储器中存储有计算机程序指令,所述计算机程序指令被所述处理器运行时用于执行上述语音合成方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于标贝(北京)科技有限公司,未经标贝(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110787732.X/2.html,转载请声明来源钻瓜专利网。





