[发明专利]一种基于数据仓库的数据处理方法有效

申请号：	201710938485.2	申请日：	2017-09-30
公开（公告）号：	CN107657049B	公开（公告）日：	2021-02-02
发明（设计）人：	黎仁全;唐明辉;李邱林;贾西贝	申请（专利权）人：	深圳市华傲数据技术有限公司
主分类号：	G06F16/28	分类号：	G06F16/28;G06F16/25
代理公司：	北京酷爱智慧知识产权代理有限公司 11514	代理人：	安娜
地址：	518000 广东省深圳市龙华新区清***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于数据仓库数据处理方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本发明提供一种基于数据仓库的数据处理方法。所述方法，包括：原子层获取结构化的第一数据；原子层按照预设形式，对第一数据进行组织归类，获得第二数据；原子层对组织归类后的第二数据进行分区存储；原子层将第二数据更新至整合层；整合层根据预设的整合规则，对第二数据进行合并处理，生成第三数据并存储。原子层通过按照预设形式，对第一数据进行组织归类，能够有效地避免数据冗余、数据缺失等情况带来的数据不一致，减少维护成本。通过对组织归类后的第一数据进行分区存储，便于对信息进行溯源。整合层通过对第二数据进行合并处理，能够使多源数据整合成唯一的信息，进而消除数据的多义性，保证数据具有唯一准确性。

技术领域

本发明涉及数据处理技术领域，具体涉及一种基于数据仓库的数据处理方法。

背景技术

随着公司在大数据城市项目的扩张计划和部署，大数据城市数据仓库项目将是每一个城市的基石项目，它是所有其它数据项目的倍增器和助推器。

现有技术中，数据仓库往往会有数据冗、数据缺失等情况，进而会造成数据不一致，增加维护成本；另外，数据仓库的数据往往来源庞杂，数据具有多义性，数据仓库的准确性较低。

发明内容

针对现有技术中的上述缺陷，本发明提供了一种基于数据仓库的数据处理方法及系统，可以有效避免数据冗余、数据缺失等情况带来的数据不一致，降低维护成本，同时，能够消除数据的多以性，进而增加数据仓库的准确性。

本发明提供的一种基于数据仓库的数据处理方法，包括：

原子层获取结构化的第一数据；

所述原子层按照预设形式，对所述第一数据进行组织归类，获得第二数据；

所述原子层对组织归类后的所述第二数据进行分区存储；

所述原子层将所述第二数据更新至整合层；

所述整合层根据预设的整合规则，对所述第二数据进行合并处理，生成第三数据并存储。

可选的，所述原子层对组织归类后的所述第一数据进行分区存储，包括：

所述原子层根据数据来源、数据周期、业务分类、关系类型中的一种或多种，对组织归类后的所述第一数据进行分区存储。

可选的，在所述整合层根据预设的整合规则，对所述第二数据进行合并处理的步骤之前，还包括：

所述整合层根据数据的非空优先原则、数据的优先级、数据的时效性、少数服从多数原则、常识性中的一种或多种，建立整合规则。

可选的，在所述建立整合规则的步骤之后，还包括：

所述整合层获取样本数据；

根据所述样本数据，对建立的所述整合规则进行验证；若验证通过，则执行所述整合层根据预设的整合规则，对所述第二数据进行合并处理，生成第三数据并存储的步骤；

若验证没有通过，则重新执行所述整合层根据数据的权威性、及时性、少数服从多数原则、常识性中的一种或多种，建立整合规则的步骤。

可选的，在所述原子层获取结构化的第一数据的步骤之前，还包括：

缓冲层缓存结构化的不同来源的源数据；并对所述源数据添加时间戳，生成缓冲数据，并存储；

所述缓冲层将所述缓冲数据更新至贴源层；

所述贴源层对所述缓冲数据进行标准化处理，生成第一数据，并存储。

可选的，还包括：

所述原子层根据预设时间周期，将所述第二数据发送给大数据库；

所述大数据库对所述第二数据进行存储。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于深圳市华傲数据技术有限公司，未经深圳市华傲数据技术有限公司许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/201710938485.2/2.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06F 电数字数据处理

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于数据仓库的数据处理方法有效

专利文献下载