[发明专利]一种数据统计方法及系统在审
| 申请号: | 201510975554.8 | 申请日: | 2015-12-23 |
| 公开(公告)号: | CN105630934A | 公开(公告)日: | 2016-06-01 |
| 发明(设计)人: | 臧勇真;赵明超;周正德;牛硕;刘安 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 济南信达专利事务所有限公司 37100 | 代理人: | 李世喆 |
| 地址: | 250100 山东*** | 国省代码: | 山东;37 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 数据 统计 方法 系统 | ||
技术领域
本发明涉及大数据处理技术领域,特别涉及一种数据统计方法及系统。
背景技术
目前,分布式集群已经成为国内外云计算研究的热点。分布式集群具有 良好的读写能力,能够支持大数据量的表格,且适用于简单业务、数据量巨 大的在线数据库及数据仓库。由于分布式集群不适合作业务数据库,一般业 务数据库往往由关系型数据库来担任,分布式集群负责汇集各个关系型数据 库中的数据。对于分布式集群这样的大数据平台,数据量的情况是一项重要 指标。
现有技术中,可以通过MapReduce程序,遍历大数据平台中存储的所有 数据,并利用时间戳字段对遍历到的满足该时间戳字段的数据进行统计,以 实现对数据量或数据总量的统计。
然而,对于大数据平台中存储的数据量非常大,表格的数量也非常多, 因此,统计效率较低,且需要耗费大量的计算、网络资源。
发明内容
有鉴于此,本发明提供一种数据统计方法及系统,以实现对大数据平台 中数据量的统计。
第一方面,本发明提供了一种数据统计方法,预先创建数据抽取记录表, 以及预先设置目标条件,包括:
监测与大数据平台相连接的至少一个关系型数据库;
在满足所述目标条件时,将具有增量数据的关系型数据库中的增量数据 抽取到大数据平台中;
更新所述数据抽取记录表;
在获取到统计指令时,根据所述数据抽取记录表响应所述统计指令。
优选地,所述满足所述目标条件,包括:到达设定时间段,和/或,所述 至少一个关系型数据库中任意一个或多个关系型数据库中具有目标数据量的 增量数据。
优选地,所述数据抽取记录表包括:rowkey项以及该rowkey项对应的 数据量;其中,所述rowkey项包括:{表名字}、{表名字}间隔符{时间}、{时 间}间隔符{表名字}中的任意一项或多项。
优选地,所述根据所述数据抽取记录表响应所述统计指令,包括:根据 所述数据抽取记录表中的rowkey项,统计至少一个表名字的数据量、至少一 个表名字在第一时间段内的数据量、在第二时间段内至少一个表名字的数据 量,以实现对所述统计指令的响应。
优选地,执行所述将目标关系型数据库中的增量数据抽取到大数据平台 中的工具包括:Sqoop工具、Kettle工具、Flume工具或Chuwa工具。
第二方面,本发明还提供了一种数据统计系统,包括:
创建单元,用于创建数据抽取记录表,并将所述数据抽取记录表发送给 更新单元;
存储单元,用于存储目标条件,并将所述目标条件发送给抽取工具;
监测单元,用于监测与大数据平台相连接的至少一个关系型数据库,并 将监测信息发送给所述抽取工具;
所述抽取工具,用于在满足所述目标条件时,将具有增量数据的关系型 数据库中的增量数据抽取到大数据平台中,并将抽取信息发送给所述更新单 元;
所述更新单元,用于更新所述数据抽取记录表,并将更新后的所述数据 抽取记录表发送给响应单元;
所述响应单元,用于在获取到统计指令时,根据所述数据抽取记录表响 应所述统计指令。
优选地,所述满足所述目标条件,包括:到达设定时间段,和/或,所述 至少一个关系型数据库中任意一个或多个关系型数据库中具有目标数据量的 增量数据。
优选地,所述数据抽取记录表包括:rowkey项以及该rowkey项对应的 数据量;其中,所述rowkey项包括:{表名字}、{表名字}间隔符{时间}、{时 间}间隔符{表名字}中的任意一项或多项。
优选地,所述响应单元,具体用于根据所述数据抽取记录表中的rowkey 项,统计至少一个表名字的数据量、至少一个表名字在第一时间段内的数据 量、在第二时间段内至少一个表名字的数据量,以实现对所述统计指令的响 应。
优选地,所述抽取工具包括:Sqoop工具、Kettle工具、Flume工具或 Chuwa工具。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510975554.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:图片推荐方法和装置
- 下一篇:对图形化信息进行格式化和导航
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





