[发明专利]地名消岐方法和地名消岐装置在审

专利信息
申请号: 201710134401.X 申请日: 2017-03-08
公开(公告)号: CN108572960A 公开(公告)日: 2018-09-25
发明(设计)人: 房璐;缪庆亮;孟遥 申请(专利权)人: 富士通株式会社
主分类号: G06F17/30 分类号: G06F17/30;G06F17/27
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 李春晖;康建峰
地址: 日本神*** 国省代码: 日本;JP
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 消岐 关联实体 相似度 匹配 检索 指向 文本 关联 开放
【说明书】:

发明公开了一种地名消岐方法和地名消岐装置。根据一个具体实施示例的地名消岐方法包括:从文本中提取待消岐地名和所述待消岐地名的上下文;从关联开放数据中检索与所述待消岐地名相关的候选地名实体;以及根据所述上下文与候选地名实体的相似度、所述待消岐地名指向候选地名实体的相对重要性、以及所述上下文与候选地名实体的属性值中所包含的关联实体之间的匹配程度中的至少一个从所述候选地名实体中选择待消岐地名实际所指的地名实体。

技术领域

本发明涉及一种地名消岐方法和地名消岐装置。

背景技术

地名消歧是地理信息检索中一项重要的任务,它对提高地理信息检索的准确率具有重要作用。当输入的文本较短时,这项任务变得更具挑战性。其中关键的问题是地名的歧义性,同样的地名可能映射到不同的物理空间位置,同一个物理空间位置也可能包含不同的名字。解决这个问题常见的策略是利用上下文信息,将待消歧地名的上下文与候选的地名真实描述文本进行比较,返回相似度最大的候选地名作为最终的结果。

由于待消歧地名的上下文与候选的地名真实描述文本一般均为纯文本,因此通常基于该特性,将文本映射到向量空间模型,然后使用向量空间模型来得到消歧结果。但是,这种常用的消岐方法忽略了词的语义重要性,消岐结果经常会出现偏差。

发明内容

在下文中给出了关于本发明的简要概述,以便提供关于本发明的某些方面的基本理解。应当理解,该概述并不是关于本发明的穷举性概述,它并非意图确定本发明的关键或重要部分,也不是意图限定本发明的范围。其目的仅仅是以简化的形式给出某些概念,以此作为后文的具体实施方式部分的铺垫。

鉴于以上提出的问题,本发明提出了一种地名消岐方法和地名消岐装置,能够考虑到词的语义重要性,从而实现地名的有效消岐。

根据本发明的一个方面,提供了一种地名消岐方法,包括:从文本中提取待消岐地名和所述待消岐地名的上下文;从关联开放数据中检索与所述待消岐地名相关的候选地名实体;以及根据所述上下文与候选地名实体的相似度、所述待消岐地名指向候选地名实体的相对重要性、以及所述上下文与候选地名实体的属性值中所包含的关联实体之间的匹配程度中的至少一个从所述候选地名实体中选择待消岐地名实际所指的地名实体。

根据本发明的另一个方面,提供了一种地名消岐装置,包括:提取单元,被配置为从文本中提取待消岐地名和所述待消岐地名的上下文;检索单元,被配置为从关联开放数据中检索与所述待消岐地名相关的候选地名实体;以及选择单元,被配置为根据所述上下文与候选地名实体的相似度、所述待消岐地名指向候选地名实体的相对重要性、以及所述上下文与候选地名实体的属性值中所包含的关联实体之间的匹配程度中的至少一个从所述候选地名实体中选择待消岐地名实际所指的地名实体。

根据本发明的再一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理系统上执行所述程序代码时,所述程序代码使得所述信息处理系统执行根据本发明的上述方法。

根据本发明的再一方面,还提供了一种程序。所述程序包括机器可执行的指令,当在信息处理系统上执行所述指令时,所述指令使得所述信息处理系统执行根据本发明的上述方法。

通过以下结合附图对本发明的最佳实施例的详细说明,本发明的这些以及其他优点将更加明显。

附图说明

参照附图来阅读本发明的各实施方式,将更容易理解本发明的其它特征和优点,在此描述的附图只是为了对本发明的实施方式进行示意性说明的目的,而非全部可能的实施,并且不旨在限制本发明的范围。在附图中:

图1示出根据本发明的一个具体实例的地名消岐方法的流程图;

图2示出根据本发明的一个具体实例的计算上下文与候选地名实体的相似度的方法的流程图;

图3示出根据本发明的一个具体实例的地名消岐装置的结构方框图;以及

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于富士通株式会社,未经富士通株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710134401.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top