[发明专利]基于Pregel的分布式起源保障正则路径查询算法在审

专利信息
申请号: 201810177109.0 申请日: 2018-03-04
公开(公告)号: CN108519994A 公开(公告)日: 2018-09-11
发明(设计)人: 王鑫;辛月祺 申请(专利权)人: 天津大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 天津市北洋有限责任专利代理事务所 12201 代理人: 刘玥
地址: 300072*** 国省代码: 天津;12
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 路径查询 正则表达式 算法 结果路径 起源 图数据 自动机 消息传递模型 扩展性 查询结果 消息传递 优化策略 中间结果 构建 等价 匹配 查询 引入 统计
【权利要求书】:

1.一种基于Pregel的分布式起源保障正则路径查询算法,其特征在于,包括以下步骤:

1)对于给定的正则路径查询Q=(x,r,y),根据正则表达式r计算first,last,follow集;

2)进一步构建正则表达式r所等价的Glushkov自动机A=(St,Σ,δ,q0,F);

3)使用Pregel消息传递模型在RDF图数据中匹配正则路径查询,通过消息传递的方式、以顶点为中心的计算之后得到结果路径;

4)统计所有满足正则表达式r的结果路径即为查询结果。

2.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤1)中,所述的正则表达式被递归定义为r::=ε|p|r/r|r|r|r*,其中ε为空串,p为字母表Σ中的任意字符,/代表连接、|代表连接、*代表闭包。

3.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤2)中,基于正则表达式构建Glushkov自动机时,用Por(r)={1,...,|r|}表示r中字符位置的集合,其中|r|表示r的长度,i∈Pos(r)是r[i]的索引。

4.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤1)中,所述的first集为正则表达式r所表示的语言L(r)中的任一字符串开头字符所对应的状态集合,所述的last集为L(r)中的任一字符串结尾字符所对应的状态集合,所述的follow集为L(r)中的任一字符串中某个位置字符的接下来字符所对应状态集。

5.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤3)中,所述的计算的过程并行在每个顶点进行,在满足自动机转换函数的条件下向前扩展一个状态q∈St来匹配v∈V,直至匹配到结束状态或不再有顶点v能够与自动机中的状态q相匹配,具体包括以下步骤:

3.1)给出判断条件:对于RDF图数据T=(V,E,l)中的每个顶点v∈V,如果每个顶点v的出边属性标签与first集中状态对应的字符一致,则该顶点v与first集中状态可以相匹配;

3.2)根据步骤3.1)的判断条件,计算与每个顶点v可能匹配的状态q,形成匹配f=(v,q),完成第一步匹配;

3.3)形成的匹配作为消息m发送给其他邻居顶点,其他邻居顶点接收消息集M;

3.4)根据接收到消息集M中已有的匹配f,计算当前匹配的下一个可能的状态q',即通过follow集继续扩展,通过顶点v的出边属性与follow集中状态对应的字符是否一致,判断该顶点v与follow集中状态是否可以匹配,如果可以匹配,向前拓展一个状态以此来满足正则表达式r;

3.5)重复步骤3.3)、3.4)直至当前顶点匹配到的状态属于last集,当前路径为结果集中的路径;

3.6)对于已经完成的路径重复步骤3.5),直至不再有新的结果路径产生。

6.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤4)中,对于步骤3)中获得的每条结果路径在该路径中匹配结束状态的顶点中保存,遍历RDF数据图的每个顶点v∈V,即可获取该查询的全部结果路径。

7.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤4)中,由于从匹配起始状态的顶点及其匹配对(v0,q0),到匹配结束状态的顶点及其匹配对(vn,qn),存在一条从v0到vn路径(v0,v1,...,vn),且qi+1=δ(qi,(vi,vi+1)),因此,满足正则表达式r的结果路径即为查询结果。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201810177109.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top