[发明专利]数据分区方法、装置、电子设备及存储介质在审
申请号: | 202111550929.8 | 申请日: | 2021-12-17 |
公开(公告)号: | CN114238278A | 公开(公告)日: | 2022-03-25 |
发明(设计)人: | 邱龙根 | 申请(专利权)人: | 中国平安财产保险股份有限公司 |
主分类号: | G06F16/21 | 分类号: | G06F16/21;G06F16/215;G06F16/23;G06F16/28 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区益田路*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 分区 方法 装置 电子设备 存储 介质 | ||
本发明涉及数据处理领域,揭露一种数据分区方法,包括:接收业务数据的分区需求,根据所述分区需求,识别所述业务数据的分区指标和分区属性;根据所述分区指标构建所述业务数据的主分区,及根据所述分区属性构建所述业务数据的子分区;实时监控所述主分区中的分区指标是否发生变化;若所述主分区中的分区指标未发生变化,则将所述业务数据加载至所述子分区中;若所述主分区中的分区指标发生变化,则定位所述主分区中的变化指标,并根据所述变化指标,更新所述子分区,将所述业务数据加载至更新后的所述子分区中。此外,本发明还涉及区块链技术,所述分区指标可存储区块链中,本发明可以数据分区的效率。
技术领域
本发明涉及数据处理领域,尤其涉及一种数据分区方法、装置、电子设备及计算机可读存储介质。
背景技术
数据分区是一种物理数据库的设计技术,它的目的是为了在特定的SQL操作中减少数据读写的总量以缩减响应时间,如数据仓库的创建,会按主题建立许多事实表,每个主题表需要存放大量指标,并且指标的数量是动态的,是不断增加的。并且每个指标的处理逻辑都是不一样的,每个指标都会对应一套处理逻辑。另外每个指标的数据都是按天存放的,并且要初始化3到4年的数据,为了增加读和写的性能,以及解耦每个指标的处理过程,需要建立数据仓库的分区。
但目前数据分区面临以下两个问题:一是建分区的脚本将会非常长,非常难以整理,从而需要浪费较多的时间,影响数据分区的效率;二是初始化的数据如果有问题,需要快速删除单个指标的数据并重新初始化,需要循环很多次循环删除分区,从而也需要浪费较多的时间,影响数据分区的效率。
发明内容
本发明提供一种数据分区方法、装置、电子设备及计算机可读存储介质,其主要目的在于提高数据分区的效率。
为实现上述目的,本发明提供的一种数据分区方法,包括:
接收业务数据的分区需求,根据所述分区需求,识别所述业务数据的分区指标和分区属性;
根据所述分区指标构建所述业务数据的主分区,及根据所述分区属性构建所述业务数据的子分区;
实时监控所述主分区中的分区指标是否发生变化;
若所述主分区中的分区指标未发生变化,则将所述业务数据加载至所述子分区中;
若所述主分区中的分区指标发生变化,则定位所述主分区中的变化指标,并根据所述变化指标,更新所述子分区,将所述业务数据加载至更新后的所述子分区中。
可选地,所述根据所述分区需求,识别所述业务数据的分区指标和分区属性,包括:
根据所述分区需求,识别所述业务数据的业务属性,根据所述业务属性,提取所述业务数据的业务特征,并确定所述业务数据的分区方式;
将所述业务特征作为所述业务数据的分区指标,根据所述分区方式,生成所述业务数据的分区属性。
可选地,所述根据所述业务属性,提取所述业务数据的业务特征,包括:
根据所述业务属性,删除所述业务数据中的无用数据,得到清洗数据,检测所述清洗数据中是否存在重复数据;
若存在重复数据,将删除重复数据中的任一个数据,得到标准数据,并识别所述标准数据是否存在异常数据;
若存在异常数据,则将所述异常数据删除后的标准数据作为所述业务数据的业务特征,若不存在异常数据,则将所述标准数据作为所述业务数据的业务特征;
若不存在重复数据,则识别所述清洗数据中是否存在异常数据;
若存在异常数据,则将所述异常数据删除后的清洗数据作为所述业务数据的业务特征,若不存在异常数据,则将所述清洗数据作为所述业务数据的业务特征。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国平安财产保险股份有限公司,未经中国平安财产保险股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111550929.8/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置