[发明专利]关键词列表形成装置及方法以及电子设备有效
申请号: | 201210581696.2 | 申请日: | 2012-12-27 |
公开(公告)号: | CN103902600B | 公开(公告)日: | 2017-12-01 |
发明(设计)人: | 吴宇;刘汝杰;岩见田均 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 王萍,陈炜 |
地址: | 日本神*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供一种关键词列表形成装置和方法以及电子设备。该关键词列表形成装置包括初始关键词形成单元,针对每个多音字,计算多音字的上下文词语对于多音字的区分度,以将区分度高于第一预定阈值的上下文词语作为初始关键词;关键词划分单元,根据初始关键词与该多音字的位置关系,将其划分为多个关键词组;和冗余关键词去除单元,针对包括至少两个初始关键词的每个关键词组,基于关键词组中的初始关键词共同出现的次数以及每个初始关键词的区分度来确定并删除冗余的初始关键词,从而形成关键词列表。本公开可获得如下效果之一提高在以关键词确定多音字发音时的计算速度;降低多音字确定时的出错概率;提高语音合成处理的效率。 | ||
搜索关键词: | 关键词 列表 形成 装置 方法 以及 电子设备 | ||
【主权项】:
一种用于形成关键词列表的关键词列表形成装置,所述关键词列表由用于确定多音字的发音的关键词构成,所述关键词列表形成装置包括:初始关键词形成单元,用于针对每个多音字,计算该多音字的上下文词语对于该多音字的区分度,以将区分度高于第一预定阈值的上下文词语作为用于确定该多音字的发音的初始关键词;关键词划分单元,用于根据初始关键词与该多音字的位置关系,将初始关键词划分为多个关键词组;以及冗余关键词去除单元,用于针对包括至少两个初始关键词的每个关键词组,基于该关键词组中的初始关键词共同出现的次数以及每个初始关键词对于该多音字的区分度来确定并删除该关键词组中的冗余的初始关键词,从而形成所述关键词列表,其中所述冗余关键词去除单元包括:共生概率判断子单元,用于针对包括至少两个初始关键词的每个关键词组,计算该关键词组中初始关键词的共生概率,并判断该共生概率是否超过第二预定阈值;以及冗余关键词去除子单元,用于在共生概率判断子单元判定该共生概率超过第二预定阈值时,将所述至少两个初始关键词中对于所述多音字的区分度较小的初始关键词删除,从而保留区分度较大的初始关键词用于形成所述关键词列表。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210581696.2/,转载请声明来源钻瓜专利网。
- 上一篇:转子式多级泵
- 下一篇:一种地脚螺栓打捆装置