[发明专利]基于结构数据的数据血缘确定方法及装置在审
申请号: | 201811090154.9 | 申请日: | 2018-09-18 |
公开(公告)号: | CN109325078A | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 梁福坤;张传凯;刘海宇 | 申请(专利权)人: | 拉扎斯网络科技(上海)有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/242;G06F17/27 |
代理公司: | 北京智信四方知识产权代理有限公司 11519 | 代理人: | 刘真 |
地址: | 200333 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开提供一种基于结构数据的数据血缘确定方法及装置,方法包括:解析选择语句得到源抽象语法树,并将遍历源抽象语法树得到的表信息和字段信息逐层组织到源清单中;解析插入语句得到目标抽象语法树,并将遍历目标抽象语法树得到的表信息和字段信息逐层组织到目标清单中;遍历源清单获取源表信息,并遍历目标清单获取目标表信息,得到表粒度的数据血缘关系;从目标清单中取出目标表的目标字段信息,从源清单的第一层开始逐层找到与目标表的目标字段信息同名的源表中的源字段,直到源字段所属的源表不再来源于子查询时,将对应的源字段确定为目标字段信息对应的具有血缘关系的源字段。该方案能够对基于结构数据的数据血缘实现字段级别粒度的解析。 | ||
搜索关键词: | 字段信息 字段 抽象语法树 遍历 结构数据 目标表 源表 解析 清单获取 血缘关系 表信息 语句 第一层 子查询 取出 | ||
【主权项】:
1.一种基于结构数据的数据血缘确定方法,其特征在于,包括:解析结构数据中的选择语句得到源抽象语法树,并将遍历所述源抽象语法树得到的表信息和字段信息逐层组织到源清单中;所述源清单中的表称为源表;解析结构数据中的插入语句得到目标抽象语法树,并将遍历所述目标抽象语法树得到的表信息和字段信息逐层组织到目标清单中;所述目标清单中的表称为目标表;遍历所述源清单获取源表信息,并遍历所述目标清单获取目标表信息,得到表粒度的数据血缘关系;从所述目标清单中取出目标表的目标字段信息,从所述源清单的第一层开始逐层找到与所述目标表的目标字段信息同名的源表中的源字段,直到所述源字段所属的源表不再来源于子查询时将对应的源字段确定为目标字段信息对应的具有血缘关系的源字段;所述目标字段信息的数量为至少一个。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于拉扎斯网络科技(上海)有限公司,未经拉扎斯网络科技(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811090154.9/,转载请声明来源钻瓜专利网。