[发明专利]一种数据库处理方法及装置有效
申请号: | 201611095424.6 | 申请日: | 2016-12-01 |
公开(公告)号: | CN108132957B | 公开(公告)日: | 2021-09-10 |
发明(设计)人: | 王威;许利群;张志鹏;常耀斌;寿文卉;方若洁;王义;于路 | 申请(专利权)人: | 中国移动通信有限公司研究院;中国移动通信集团公司 |
主分类号: | G06F16/22 | 分类号: | G06F16/22 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 王军红;张颖玲 |
地址: | 100053 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 数据库 处理 方法 装置 | ||
本发明公开了一种数据库处理方法,包括:利用源数据库的表结构信息,获取含有单主键的至少一个第一表;针对每个含有单主键的第一表,将单主键数据与所述源数据库中除所述至少一个第一表外的第二表进行匹配,建立含有单主键的第一表与第二表之间的主从表关系;利用建立的主从表关系,利用左连接的方式确定源数据库的表之间的关联关系;对得到的关联关系进行排序和合并,生成关系树。本发明同时还公开了一种数据库处理装置。
技术领域
本发明涉及大数据处理领域,尤其涉及一种数据库处理方法及装置。
背景技术
对结构化数据库中数据进行大数据分析,首先要分析数据库中表之间的关联关系,然后才能根据关联关系将多个表关联起来生成数据集。
然而,目前进行结构化数据库关联关系分析时,基本都是依据开发过程中生成的数据库设计文档,或者在开发人员的协助下,进行人工分析与校验,需要大量时间与人力成本,同时不能保证结果的准确性和完整性。
发明内容
为解决现有存在的技术问题,本发明实施例提供一种数据库处理方法及装置。
本发明实施例的技术方案是这样实现的:
本发明实施例提供了一种数据库处理方法,包括:
利用源数据库的表结构信息,获取含有单主键的至少一个第一表;
针对每个含有单主键的第一表,将单主键数据与所述源数据库中除所述至少一个第一表外的第二表进行匹配,建立含有单主键的第一表与第二表之间的主从表关系;
利用建立的主从表关系,利用左连接的方式确定源数据库的表之间的关联关系;
对得到的关联关系进行排序和合并,生成关系树。
上述方案中,所述方法还包括:
获取所述源数据库的配置信息;
利用所述配置信息对所述源数据库字典进行分析,得到所述表结构信息。
上述方案中,所述利用所述配置信息,得到所述表结构信息,包括:
对所述配置信息进行校验,校验通过后利用所述配置信息对所述源数据库字典进行分析,得到所述表结构信息。
上述方案中,所述针对每个含有单主键的第一表,将单主键数据与所述源数据库中除所述至少一个第一表外的第二表进行匹配,建立含有单主键的第一表与第二表之间的主从表关系,包括:
针对每个第二表,查找与第一表的单主键数据中的单主键名称、对应的数据类型和长度相匹配的第一字段;
当所述第一字段对应的数据与所述单主键对应的数据相同时,确定第一表与第二表之间的主从表关系。
上述方案中,所述方法还包括:
按照第一预设规则,从确定的所述主从表关系中确定异常结果;
利用所述异常结果,结合建立的模型,确定所述主从表关系的准确概率;
相应地,利用准确概率满足第二预设规则的主从表关系,利用左连接的方式确定源数据库的表之间的关联关系。
上述方案中,所述方法还包括:
建立所述主从表关系后,保存所述主从表关系;
相应地,获取所述源数据库的配置信息;
利用所述配置信息对所述源数据库字典进行分析,得到保存的所述主从表关系。
上述方案中,所述利用所述配置信息对所述源数据库字典进行分析,得到保存的所述主从表关系,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国移动通信有限公司研究院;中国移动通信集团公司,未经中国移动通信有限公司研究院;中国移动通信集团公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611095424.6/2.html,转载请声明来源钻瓜专利网。