[发明专利]一种数据库表结构分析方法和系统在审
| 申请号: | 201711396232.3 | 申请日: | 2017-12-21 |
| 公开(公告)号: | CN108108441A | 公开(公告)日: | 2018-06-01 |
| 发明(设计)人: | 吕军震;刘杰;胥洪锋;于国方;李长松;武佳 | 申请(专利权)人: | 新博卓畅技术(北京)有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 北京驰纳智财知识产权代理事务所(普通合伙) 11367 | 代理人: | 孙海波 |
| 地址: | 065001 河北省*** | 国省代码: | 河北;13 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 数据库 关联关系 数据库表结构 表间关系 关联分析算法 数据关联分析 使用数据 随机样本 图形展示 样本数据 分析 表结构 导出 解析 | ||
1.一种数据库表结构分析方法,包括从数据库导出html文件,其特征在于,包括以下步骤:
步骤1:对所述html文件进行解析,并从文件中获取适当数量的随机样本数据;
步骤2:依据所述样本数据使用数据关联分析算法,得到可能的关联关系;
步骤3:分析所述关联关系的可能性并处理;
步骤4:根据得到的所述关联关系,以图形展示数据库的表间关系。
2.如权利要求1所述的数据库表结构分析方法,其特征在于:所述步骤2包括以下子步骤:
步骤21:确定并行线程数;
步骤22:多线程并行任务分配;
步骤23:根据所述样本,遍历所述Html文件,获得可能存在关联的表关系集。
3.如权利要求2所述的数据库表结构分析方法,其特征在于:通过递归或循环的方式实现所述表关系集的获取,其中采用anlysisAssociation、parseHtmlToDataSet、threadParallel、scan_files、AnsTable和dataNode中至少一种方法和类。
4.如权利要求5所述的数据库表结构分析方法,其特征在于:所述parseHtmlToDataSet为主方法,递归实现用于获取表关系集。
5.如权利要求6所述的数据库表结构分析方法,其特征在于:所述AnsTable是解析所述html文件的主体,是获取所述关系集的主要实现
6.一种数据库表结构分析系统,包括用于从数据库中导出html文件的导出模块,其特征在于,包括以下模块:
文件解析模块:用于对所述html文件进行解析,并从文件中获取适当数量的随机样本数据;
数据分析模块:用于依据所述样本数据使用数据关联分析算法,得到可能的关联关系;
数据处理模块:用于分析所述关联关系的可能性并处理;
关系展示模块:用于根据得到的所述关联关系,以图形展示数据库的表间关系。
7.如权利要求6所述的数据库表结构分析系统,其特征在于:所述数据分析模块包括以下子模块:
线程确定子模块:用于确定并行线程数;
任务分配子模块:用于多线程并行任务分配;
遍历子模块:用于根据所述样本,遍历所述Html文件,获得可能存在关联的表关系集。
8.如权利要求7所述的数据库表结构分析系统,其特征在于:通过递归或循环的方式实现所述表关系集的获取,其中采用anlysisAssociation、parseHtmlToDataSet、threadParallel、scan_files、AnsTable和dataNode中至少一种方法和类。
9.如权利要求8所述的数据库表结构分析系统,其特征在于:所述dataNode用于存储数据。
10.如权利要求9所述的数据库表结构分析系统,其特征在于:所述scan_files这用于读取所述html文件集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于新博卓畅技术(北京)有限公司,未经新博卓畅技术(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711396232.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:代理服务器及互联网数据的采集方法
- 下一篇:一种优化网页浏览的方法





