[发明专利]基于Pregel的分布式起源保障正则路径查询算法在审
| 申请号: | 201810177109.0 | 申请日: | 2018-03-04 |
| 公开(公告)号: | CN108519994A | 公开(公告)日: | 2018-09-11 |
| 发明(设计)人: | 王鑫;辛月祺 | 申请(专利权)人: | 天津大学 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 刘玥 |
| 地址: | 300072*** | 国省代码: | 天津;12 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 路径查询 正则表达式 算法 结果路径 起源 图数据 自动机 消息传递模型 扩展性 查询结果 消息传递 优化策略 中间结果 构建 等价 匹配 查询 引入 统计 | ||
1.一种基于Pregel的分布式起源保障正则路径查询算法,其特征在于,包括以下步骤:
1)对于给定的正则路径查询Q=(x,r,y),根据正则表达式r计算first,last,follow集;
2)进一步构建正则表达式r所等价的Glushkov自动机A=(St,Σ,δ,q0,F);
3)使用Pregel消息传递模型在RDF图数据中匹配正则路径查询,通过消息传递的方式、以顶点为中心的计算之后得到结果路径;
4)统计所有满足正则表达式r的结果路径即为查询结果。
2.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤1)中,所述的正则表达式被递归定义为r::=ε|p|r/r|r|r|r*,其中ε为空串,p为字母表Σ中的任意字符,/代表连接、|代表连接、*代表闭包。
3.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤2)中,基于正则表达式构建Glushkov自动机时,用Por(r)={1,...,|r|}表示r中字符位置的集合,其中|r|表示r的长度,i∈Pos(r)是r[i]的索引。
4.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤1)中,所述的first集为正则表达式r所表示的语言L(r)中的任一字符串开头字符所对应的状态集合,所述的last集为L(r)中的任一字符串结尾字符所对应的状态集合,所述的follow集为L(r)中的任一字符串中某个位置字符的接下来字符所对应状态集。
5.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤3)中,所述的计算的过程并行在每个顶点进行,在满足自动机转换函数的条件下向前扩展一个状态q∈St来匹配v∈V,直至匹配到结束状态或不再有顶点v能够与自动机中的状态q相匹配,具体包括以下步骤:
3.1)给出判断条件:对于RDF图数据T=(V,E,l)中的每个顶点v∈V,如果每个顶点v的出边属性标签与first集中状态对应的字符一致,则该顶点v与first集中状态可以相匹配;
3.2)根据步骤3.1)的判断条件,计算与每个顶点v可能匹配的状态q,形成匹配f=(v,q),完成第一步匹配;
3.3)形成的匹配作为消息m发送给其他邻居顶点,其他邻居顶点接收消息集M;
3.4)根据接收到消息集M中已有的匹配f,计算当前匹配的下一个可能的状态q',即通过follow集继续扩展,通过顶点v的出边属性与follow集中状态对应的字符是否一致,判断该顶点v与follow集中状态是否可以匹配,如果可以匹配,向前拓展一个状态以此来满足正则表达式r;
3.5)重复步骤3.3)、3.4)直至当前顶点匹配到的状态属于last集,当前路径为结果集中的路径;
3.6)对于已经完成的路径重复步骤3.5),直至不再有新的结果路径产生。
6.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤4)中,对于步骤3)中获得的每条结果路径在该路径中匹配结束状态的顶点中保存,遍历RDF数据图的每个顶点v∈V,即可获取该查询的全部结果路径。
7.根据权利要求1所述的一种基于Pregel的分布式起源保障正则路径查询算法,步骤4)中,由于从匹配起始状态的顶点及其匹配对(v0,q0),到匹配结束状态的顶点及其匹配对(vn,qn),存在一条从v0到vn路径(v0,v1,...,vn),且qi+1=δ(qi,(vi,vi+1)),因此,满足正则表达式r的结果路径即为查询结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810177109.0/1.html,转载请声明来源钻瓜专利网。





