[发明专利]RDF数据上基于图匹配的why-not查询回答方法有效
申请号: | 201710285751.6 | 申请日: | 2017-04-27 |
公开(公告)号: | CN107193882B | 公开(公告)日: | 2020-11-20 |
发明(设计)人: | 漆桂林;黄超;高桓 | 申请(专利权)人: | 东南大学 |
主分类号: | G06F16/36 | 分类号: | G06F16/36 |
代理公司: | 南京苏高专利商标事务所(普通合伙) 32204 | 代理人: | 王安琪 |
地址: | 211189 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | rdf 数据 基于 匹配 why not 查询 回答 方法 | ||
本发明公开了一种RDF数据上基于图匹配的why‑not查询回答方法,包括如下步骤:(1)离线数据结构处理;(2)将why‑not问题中的关键字映射到RDF数据上的实体;(3)从候选实体出发,构造一个局部图;(4)查询分解;(5)图匹配;(6)生成why‑not问题的解释。本发明的有益效果为:本发明采用的方法可以更好、更高效的确定导致用户感兴趣的项被筛选掉的原因,并且给出相应的比较具体的修改意见,方便用户更好的去探索用户期望得到的结果,通常可以让用户更加满意。
技术领域
本发明涉及计算机技术领域,尤其是一种RDF数据上基于图匹配的why-not查询回答方法。
背景技术
近年来,大量的RDF数据开始以开放链接数据的形式被发布到互联网上,并且形成了很多开放链接知识库或者垂直领域知识库,比如Freebase、Yago、DBpedia、ConceptNet等等。这些知识库逐渐被集成到一些现实生活中的应用场景里面,比如搜索引擎或者查询回答系统,从而更好的服务于用户。为了使得用户可以更直接、方便的去获取知识,基于知识库的查询回答系统开始扮演重要的角色。一些基于RDF数据的查询回答系统,比如Auqlog、FREyA、NLP-Reduce等,使得用户不需要了解底层知识库的词汇或者模式信息,也可以满足他们任意复杂的信息需求。
对于基于知识库的查询回答系统,其底层的数据通常是从web上进行信息抽取,然后将数据组织成RDF三元组或者其他形式的知识单元存放在知识库中。然而信息抽取通常不是完全精准的,在信息抽取的过程中,通常会因为信息源的不可靠或者抽取方法的局限性导致一些错误信息蔓延到数据库中,导致数据本身的准确性有所下降。因而当用户通过查询回答系统来获取问题的答案时,系统可能返回给用户不正确的结果,在用户好奇心的驱使下,用户会自然而然的产生为什么用户想要的答案没有出现在结果集中这种问题,这种问题被称作为why-not问题。通常情况下,用户要解决这种问题,需要不断的更改自己的查询条件来对比不同的结果集,并分析用户期望的数据的相关信息,才能得出为什么用户期望的结果没有出现在结果集中的原因。然而在数据量的规模很大的情况下,以及用户输入受限时,并不是每次用户都能如愿分析出原因。此时,由系统根据用户的反馈来为用户计算出比较合理的解释便成为一种提高数据库可用性的需求。
在解决RDF上的why-not问题方面,Yao等人给出了一种解决方案,该方法通过一种简单的不断试错的方式来找到用户查询中导致答案缺失的关系或者概念,并且使用一些启发式规则进行泛化来修正查询。该方法对应的系统ANNA由于需要遍历各种情形进行试错,计算解释的效率不高,而且通过泛化得到的结果在大部分情况下并不能给出用户一种细粒度的解释。
发明内容
本发明所要解决的技术问题在于,提供一种RDF数据上基于图匹配的why-not查询回答方法,为用户提供一种合理的解释,指导用户更好的完善和明确查询需求,更快的获取自己期望的结果。
为解决上述技术问题,本发明提供一种RDF数据上基于图匹配的why-not查询回答方法,包括如下步骤;
(1)离线数据结构处理;
该步骤对RDF数据进行数据结构上的预处理,包括三个方面:一是使用Jena对RDF数据进行本地持久化存储,二是使用Lucene对知识库中所有实体的标签建立倒排索引,三是训练一个word2vec模型为知识库中的每个实体和关系生成一个向量;
(2)将why-not问题中的关键字映射到RDF数据上的实体;
对于用户提出的why-not问题,得到用户所感兴趣的项的关键字,然后从步骤(1)所建立的索引库中检索该关键字对应的实体,从而将关键字映射到知识库上的实体上去,得到一个候选实体集合;
(3)从候选实体出发,构造一个局部图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710285751.6/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置