[发明专利]关键词列表形成装置及方法以及电子设备有效
申请号: | 201210581696.2 | 申请日: | 2012-12-27 |
公开(公告)号: | CN103902600B | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 吴宇;刘汝杰;岩见田均 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王萍,陈炜 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 关键词 列表 形成 装置 方法 以及 电子设备 | ||
技术领域
本公开涉及语音合成领域,尤其关键词列表形成装置及方法以及包括该关键词列表形成装置的电子设备。
背景技术
在语音合成处理中,实现从文本至语音的转换是至关重要的,即对于任意输入的文本,需要将其转换为对应的发音。然而由于中文中存在大量的多音字,因此如何确定多音字的发音就成为针对中文文本的语音合成领域中需要重点解决的问题。目前常用的用于解决中文文本中多音字发音问题的方法包括:通过选取包括用于确定多音字的关键词等的特征作为基本特征为每个多音字建立的概率模型,从而基于该模型确定该多音字的发音。然而当前选取关键词的方法主要是基于多音字的上下文所包含的字或词对多音字的区分能力选取区分能力高的关键词。但是通过这种方法选取的关键词可能存在冗余,其导致计算的复杂度增加,从而判断多音字发音出错的概率增大。
因此,当前亟需一种能够去除冗余关键词的关键词列表形成装置和方法。
发明内容
在下文中给出了关于本公开的简要概述,以便提供关于本公开的某些方面的基本理解。应当理解,这个概述并不是关于本公开的穷举性概述。它并不意图确定本公开的关键或重要部分,也不意图限定本公开的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。
鉴于现有技术的上述缺陷,本公开的目的之一是提供一种关键词列表形成装置及方法以及信息处理设备,以至少克服现有技术中的关键词选取方法所选取的关键词存在冗余的问题。
根据本公开的一个方面,提供了一种用于形成关键词列表的关键词列表形成装置,该关键词列表由用于确定多音字的发音的关键词构成,该关键词列表形成装置包括:初始关键词形成单元,用于针对每个多音字,计算该多音字的上下文词语对于该多音字的区分度,以将区分度高于第一预定阈值的上下文词语作为用于确定该多音字的发音的初始关键词;关键词划分单元,用于根据初始关键词与该多音字的位置关系,将初始关键词划分为多个关键词组;以及冗余关键词去除单元,用于针对包括至少两个初始关键词的每个关键词组,基于该关键词组中的初始关键词共同出现的次数以及每个初始关键词对于该多音字的区分度来确定并删除该关键词组中的冗余的初始关键词,从而形成所述关键词列表。
根据本公开的又一个方面,还提供一种用于形成关键词列表的方法,该关键词列表由用于确定多音字的发音的关键词构成,该方法包括:初始关键词形成步骤,针对每个多音字,计算该多音字的上下文词语对于该多音字的区分度,以将区分度高于第一预定阈值的上下文词语作为用于确定该多音字的发音的初始关键词;关键词划分步骤,根据初始关键词与该多音字的位置关系,将初始关键词划分为多个关键词组;以及冗余关键词去除步骤,针对包括至少两个初始关键词的每个关键词组,基于该关键词组中的初始关键词共同出现的次数以及每个初始关键词对于该多音字的区分度来确定并删除该关键词组中的冗余的初始关键词,从而形成所述关键词列表。
根据本公开的另一个方面,还提供了一种电子设备,该电子设备包括如上所述的关键词列表形成装置。
依据本公开的其它方面,还提供了一种使得计算机用作如上所述的关键词列表形成装置的程序。
依据本公开的又一方面,还提供了相应的计算机可读存储介质,该计算机可读存储介质上存储有能够由计算设备执行的计算机程序,所述程序在执行时能够使所述计算设备执行上述关键词列表形成方法。
上述根据本公开实施例的关键词列表形成装置和方法以及电子设备,至少能够获得以下益处之一:能够提高在以关键词确定多音字发音时的计算速度;降低多音字确定时的出错概率;提高语音合成处理的效率。
通过以下结合附图对本公开的最佳实施例的详细说明,本公开的这些以及其他优点将更加明显。
附图说明
本公开可以通过参考下文中结合附图所给出的描述而得到更好的理解,其中在所有附图中使用了相同或相似的附图标记来表示相同或者相似的部件。所述附图连同下面的详细说明一起包含在本说明书中并且形成本说明书的一部分,而且用来进一步举例说明本公开的优选实施例和解释本公开的原理和优点。其中:
图1是示意性地示出根据本公开实施例的关键词列表形成装置的一种示例结构的框图。
图2是示意性地示出如图1所示的初始关键词形成单元的一种可能的示例结构的框图。
图3是示意性地示出如图1所示的冗余关键词去除单元的一种可能的示例结构的框图。
图4是根据本公开实施例的用于形成关键词列表的方法的一种示例性处理的流程图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201210581696.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:转子式多级泵
- 下一篇:一种地脚螺栓打捆装置