[发明专利]地名消岐方法和地名消岐装置在审
申请号: | 201710134401.X | 申请日: | 2017-03-08 |
公开(公告)号: | CN108572960A | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 房璐;缪庆亮;孟遥 | 申请(专利权)人: | 富士通株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06F17/27 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李春晖;康建峰 |
地址: | 日本神*** | 国省代码: | 日本;JP |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 消岐 关联实体 相似度 匹配 检索 指向 文本 关联 开放 | ||
本发明公开了一种地名消岐方法和地名消岐装置。根据一个具体实施示例的地名消岐方法包括:从文本中提取待消岐地名和所述待消岐地名的上下文;从关联开放数据中检索与所述待消岐地名相关的候选地名实体;以及根据所述上下文与候选地名实体的相似度、所述待消岐地名指向候选地名实体的相对重要性、以及所述上下文与候选地名实体的属性值中所包含的关联实体之间的匹配程度中的至少一个从所述候选地名实体中选择待消岐地名实际所指的地名实体。
技术领域
本发明涉及一种地名消岐方法和地名消岐装置。
背景技术
地名消歧是地理信息检索中一项重要的任务,它对提高地理信息检索的准确率具有重要作用。当输入的文本较短时,这项任务变得更具挑战性。其中关键的问题是地名的歧义性,同样的地名可能映射到不同的物理空间位置,同一个物理空间位置也可能包含不同的名字。解决这个问题常见的策略是利用上下文信息,将待消歧地名的上下文与候选的地名真实描述文本进行比较,返回相似度最大的候选地名作为最终的结果。
由于待消歧地名的上下文与候选的地名真实描述文本一般均为纯文本,因此通常基于该特性,将文本映射到向量空间模型,然后使用向量空间模型来得到消歧结果。但是,这种常用的消岐方法忽略了词的语义重要性,消岐结果经常会出现偏差。
发明内容
在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,该概述并不是关于本发明的穷举性概述,它并非意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为后文的具体实施方式部分的铺垫。
鉴于以上提出的问题,本发明提出了一种地名消岐方法和地名消岐装置,能够考虑到词的语义重要性,从而实现地名的有效消岐。
根据本发明的一个方面,提供了一种地名消岐方法,包括:从文本中提取待消岐地名和所述待消岐地名的上下文;从关联开放数据中检索与所述待消岐地名相关的候选地名实体;以及根据所述上下文与候选地名实体的相似度、所述待消岐地名指向候选地名实体的相对重要性、以及所述上下文与候选地名实体的属性值中所包含的关联实体之间的匹配程度中的至少一个从所述候选地名实体中选择待消岐地名实际所指的地名实体。
根据本发明的另一个方面,提供了一种地名消岐装置,包括:提取单元,被配置为从文本中提取待消岐地名和所述待消岐地名的上下文;检索单元,被配置为从关联开放数据中检索与所述待消岐地名相关的候选地名实体;以及选择单元,被配置为根据所述上下文与候选地名实体的相似度、所述待消岐地名指向候选地名实体的相对重要性、以及所述上下文与候选地名实体的属性值中所包含的关联实体之间的匹配程度中的至少一个从所述候选地名实体中选择待消岐地名实际所指的地名实体。
根据本发明的再一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理系统上执行所述程序代码时,所述程序代码使得所述信息处理系统执行根据本发明的上述方法。
根据本发明的再一方面,还提供了一种程序。所述程序包括机器可执行的指令,当在信息处理系统上执行所述指令时,所述指令使得所述信息处理系统执行根据本发明的上述方法。
通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。
附图说明
参照附图来阅读本发明的各实施方式,将更容易理解本发明的其它特征和优点,在此描述的附图只是为了对本发明的实施方式进行示意性说明的目的,而非全部可能的实施,并且不旨在限制本发明的范围。在附图中:
图1示出根据本发明的一个具体实例的地名消岐方法的流程图;
图2示出根据本发明的一个具体实例的计算上下文与候选地名实体的相似度的方法的流程图;
图3示出根据本发明的一个具体实例的地名消岐装置的结构方框图;以及
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710134401.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种与数据库交互数据的方法和装置
- 下一篇:一种文本的向量化方法以及装置