[发明专利]基于数据仓库的文件移动方法、设备和存储介质在审
申请号: | 202011036803.4 | 申请日: | 2020-09-28 |
公开(公告)号: | CN112115115A | 公开(公告)日: | 2020-12-22 |
发明(设计)人: | 何鑫;王斌;吕电福 | 申请(专利权)人: | 企查查科技有限公司 |
主分类号: | G06F16/185 | 分类号: | G06F16/185;G06F16/215;G06F16/28 |
代理公司: | 苏州威世朋知识产权代理事务所(普通合伙) 32235 | 代理人: | 董燕 |
地址: | 215000 江苏省苏州市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 数据仓库 文件 移动 方法 设备 存储 介质 | ||
1.一种基于数据仓库的文件移动方法,其特征在于,所述方法包括:
获取待筛选的数据信息,将所述数据信息发送给可执行文件;
所述可执行文件根据预设的数据移动规则,对所述数据信息进行遍历,得到待移动的数据信息;
所述可执行文件根据所述待移动的数据信息,从数据仓库中得到所述待移动的数据信息指向热存储区域的映射路径,将所述待移动的数据信息从热存储区域移动到冷存储区域,并修改所述待移动的数据信息在数据仓库中的映射路径指向冷存储区域。
2.根据权利要求1所述基于数据仓库的文件移动方法,其特征在于,所述“所述可执行文件根据所述待移动的数据信息,从数据仓库中得到所述待移动的数据信息指向热存储区域的映射路径,将所述待移动的数据信息从热存储区域移动到冷存储区域,并修改所述待移动的数据信息在数据仓库中的映射路径指向冷存储区域”包括:
所述可执行文件根据所述待移动的数据信息,从数据仓库中得到所述待移动数据信息指向热存储区域的映射路径;
根据所述待移动的数据信息,在冷存储区域根据预设的路径生成规则生成对应的存储路径;
将所述待移动的数据信息从热存储区域复制到冷存储区域对应的存储路径下;
修改所述待移动的数据信息在数据仓库中的映射路径,所述映射路径指向冷存储区域对应的存储路径;
删除所述热存储区域中存储的所述待移动的数据信息。
3.根据权利要求2所述基于数据仓库的文件移动方法,其特征在于:
所述预设的路径生成规则是根据存储区域类型、日期和业务类型来生成路径。
4.根据权利要求1所述基于数据仓库的文件移动方法,其特征在于:
所述预设的数据移动规则,包括基于业务优先级进行移动、基于创建/访问时间进行移动、基于数据分层进行移动,其中,所述预设的数据移动规则的优先级从高到低依次为基于业务优先级进行移动、基于创建/访问时间进行移动、基于数据分层进行移动。
5.根据权利要求4所述基于数据仓库的文件移动方法,其特征在于:
所述基于业务优先级进行移动,是指企业重要维度的数据信息存储在热存储区域;
所述基于创建/访问时间进行移动,是指将第一预定时段前创建的数据信息或第二预定时间段内没有被访问的数据信息,移动到冷数据存储区域;
所述基于数据分层进行移动,是指将整个数据仓库存储的数据分为原始数据、清理过程数据和汇总数据,将所述原始数据存入冷数据存储区域。
6.根据权利要求1所述基于数据仓库的文件移动方法,其特征在于,所述“获取待筛选的数据信息”包括:
在某个数据清洗任务成功完成后,获取所述任务涉及的数据信息作为待筛选的数据信息。
7.根据权利要求1所述基于数据仓库的文件移动方法,其特征在于,所述“获取待筛选的数据信息”包括:
当定时时间到时,获取数据仓库中的所有数据库与表作为待筛选的数据信息。
8.根据权利要求1所述基于数据仓库的文件移动方法,其特征在于:
所述热存储区域为使用isilon存储系统构建hdfs文件存储系统;
所述冷存储区域为使用S3协议构建的对象存储系统。
9.一种电子设备,包括存储器和处理器,所述存储器存储有可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述程序时实现权利要求1-8任意一项所述基于数据仓库的文件移动方法中的步骤。
10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-8任意一项所述基于数据仓库的文件移动方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于企查查科技有限公司,未经企查查科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011036803.4/1.html,转载请声明来源钻瓜专利网。