[发明专利]一种基于海量数据迁移的数据抽取加载方法有效

申请号：	201710028883.0	申请日：	2017-01-16
公开（公告）号：	CN106777345B	公开（公告）日：	2020-07-28
发明（设计）人：	董志鹏;徐兵兵;丁庆申;郭凤	申请（专利权）人：	浪潮软件科技有限公司
主分类号：	G06F16/25	分类号：	G06F16/25;G06F16/27
代理公司：	济南信达专利事务所有限公司 37100	代理人：	姜明
地址：	250100 山东省济***	国省代码：	山东;37
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于海量数据迁移抽取加载方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于海量数据迁移的数据抽取加载方法，其特征在于，其实现过程为：首先进行数据抽取，通过创建临时用户，使外部表与数据源分离，对海量数据进行分区并行切分产生若干个dump文件；然后进行数据加载，即对数据进行解析与处理，转换过滤异常数据，最终采用批量导入数据的方式将数据迁移到目标数据源中；

当开始抽取数据的时候，首先查找是否有权限读取数据，满足权限条件后，开始生成外部表dump，一个表可并行生成若干个dump；

一个表并行生成若干个dump的具体过程为：使用外部表的数据泵oracle_datadump引擎，在指定的目录下生成若干个dump文件，并可指定并行度，指定dump名称；

数据加载时，在目标环境中创建只读用户、外部表用户，外部表用户中存放需要加载的外部表，整个外部表的dump文件加载可即插即用，使用完毕后直接卸载即可；

数据加载通过insert append的方式进行数据导入，根据数据情况进行切分粒度控制，将大数据在数据抽取的时候进行细粒度切分，产生若干个dump文件，缓解undo操作的压力；

在数据加载前还包括数据比较的步骤，通过比较只读用户和外部表用户中的外部表数据，即目标数据和源数据，匹配主键列，进行数据的冗余比较。

2.根据权利要求1所述的一种基于海量数据迁移的数据抽取加载方法，其特征在于，所述临时用户是指只读用户、外部表用户，其中只读用户具有数据源中的select权限；外部表用户，该用户通过创建外部表生成dump文件，外部表用户继承只读用户中的select权限。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浪潮软件科技有限公司，未经浪潮软件科技有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710028883.0/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载