[发明专利]一种基于向量空间的RDF结构化查询自动构建方法有效

专利信息
申请号: 201811197729.7 申请日: 2018-10-15
公开(公告)号: CN109408527B 公开(公告)日: 2020-12-01
发明(设计)人: 王瑞杰;刘均;王萌 申请(专利权)人: 广东顺德西安交通大学研究院
主分类号: G06F16/242 分类号: G06F16/242;G06F16/2453;G06F16/36
代理公司: 西安通大专利代理有限责任公司 61200 代理人: 高博
地址: 528399 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 向量 空间 rdf 结构 查询 自动 构建 方法
【说明书】:

本发明公开了一种基于向量空间的RDF结构化查询自动构建方法,利用概括局部子图将RDF图映射到连续向量空间中,学习RDF图中每个节点与边的向量表示;在给定通过自然语言问题表达的查询意图后,提取问题中的实体、关系短语,并将它们在RDF图中匹配得到候选匹配节点、边;然后,利用RDF图的向量表示将候选匹配节点、边的集合表示为向量并计算最优查询结构;最后利用翻译机制选取每个候选集合中的最优匹配节点、边并生成目标结构化查询。通过对RDF图向量表示的利用,查询构建的效率得到了大大提高;同时可以避免在确定结构过程中对实体与关系短语进行精确的匹配,提高了匹配的召回率;在最后的查询生成过程中,翻译机制也保证了所生成查询与RDF图的一致性。

技术领域

本发明属于基于RDF数据自动回答自然语言问题技术领域,具体涉及一种基于向量空间的RDF结构化查询自动构建方法。

背景技术

RDF全称为资源描述框架(Resource Description Framework),是国际互联网协会(W3C)推荐的一种发布、分享和连接互联网上各类数据资源的标准规范。近年来,越来越多的大规模RDF图数据,例如DBpedia和Wikidata,被发布在了互联网上。大规模RDF图中包含了丰富的信息。目前,对RDF图进行查询的主要方法是使用结构化的查询语言,例如SPARQL和GraphQL。然而,结构化查询语言的语法规则较为复杂,且在使用时要求用户对RDF图的结构与模式有着精确的认识。这大大阻碍了普通用户对RDF数据的利用,也不利于RDF数据的发展。因此,怎样将用户使用自然语言表达的查询意图自动地转换为可以直接在RDF图中进行查询的结构化查询成为了近年来的研究热点。

现有存在问题如下:

1)首先其针对的是用户输入的关键字,而在很多情况下关键字并不能清楚地表达用户的查询意图,例如:如果用户想查询“奥巴马的妻子的母校是什么?”,那么如果只输入关键词“奥巴马”、“妻子”、“母校”的话,就无法确定用户是想查询“奥巴马的母校”还是“妻子的母校”。而本专利针对的是自然语言问题,因此适用范围更加广范,查询结果更加精确;

2)上述专利是基于传统图论的方法搜索子图并生成SPARQL查询的,如果应用于规模巨大的RDF图,其效率将会变得非常低。而本专利是基于离线过程中学习得到的向量表示进行的,结构化查询的构建主要是数值运算过程,因此效率更高。

发明内容

本发明所要解决的技术问题在于针对上述现有技术中的不足,提供一种基于向量空间的RDF结构化查询自动构建方法,以离线过程中学习得到的RDF图的向量表示为基础,通过数值运算的方式高效准确地根据输入的自然语言问题构建结构化查询。

本发明采用以下技术方案:

一种基于向量空间的RDF结构化查询自动构建方法,首先利用概括局部子图将RDF图映射到连续向量空间中,学习RDF图中每个节点与边的向量表示;然后给定通过自然语言问题表达的查询意图后,提取问题中的实体、关系短语,并在RDF图中匹配得到候选匹配节点、边;再利用RDF图的向量表示将候选匹配节点、边的集合表示为向量并计算最优查询结构;最后利用翻译机制选取每个候选集合中的最优匹配节点、边并生成目标结构化查询。

具体的,利用概括局部子图将RDF图映射到连续向量空间中,学习RDF图中每个节点与边的向量表示具体包括以下步骤:

S101、设为RDF图中节点的集合,ε为RDF图中边的集合;一条RDF三元组为(vh,e,vt),其中,即头节点vh由边e指向尾节点vt,一个RDF图是RDF三元组的有限集合;

S102、对于RDF图中的一个节点其局部子图为三元组集合如下:

对于RDF图中的一个边e∈ε,其局部子图为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东顺德西安交通大学研究院,未经广东顺德西安交通大学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201811197729.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top