[发明专利]无线城市大数据离线处理系统及其大数据离线处理方法在审
申请号: | 201711044154.0 | 申请日: | 2017-10-31 |
公开(公告)号: | CN107908683A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 余保华;邓惠元;范联伟;徐圣吉;展昭;张金国;吴磊;胡鸿超 | 申请(专利权)人: | 安徽四创电子股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 合肥和瑞知识产权代理事务所(普通合伙)34118 | 代理人: | 王挺 |
地址: | 230088 安徽省合肥*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 无线 城市 数据 离线 处理 系统 及其 方法 | ||
1.无线城市大数据离线处理系统,其特征在于:包括定时增量模块(10)、抽取匹配模块(20)、存储模块(30)、分析模块(40)以及统计模块(50),其中,
定时增量模块(10),用于获取无线城市大数据的定时增量数据;
抽取匹配模块(20),用于读取所述定时增量模块(10)获取到的定时增量数据,并对所述定时增量数据进行抽取匹配,得到匹配数据;
存储模块(30),用于接收并存储来自抽取匹配模块(20)的匹配数据;
分析模块(40),用于读取并分析存储于存储模块(30)中的匹配数据;
统计模块(50),用于统计并展示所述分析模块(40)分析后的匹配数据。
2.如权利要求1所述的无线城市大数据离线处理系统,其特征在于:所述存储模块(30)包括数据内容库和数据来源库;所述数据内容库按照键值的方式存储匹配数据的内容,所述数据来源库用于存储匹配数据的来源。
3.如权利要求2所述的无线城市大数据离线处理系统,其特征在于:所述分析模块(40)运用无线城市大数据计算框架分析存储于存储模块(30)中的匹配数据。
4.如权利要求3所述的无线城市大数据离线处理系统,其特征在于:所述定时增量模块(10)和抽取匹配模块(20)构成了本大数据离线处理系统的业务层;所述业务层由功能层提供数据支持和决策依据,所述功能层包括统计模块(50);所述功能层由平台层提供软件基础,所述平台层包括分析模块(40);所述平台层由基础层提供大数据离线处理环境,所述基础层包括存储模块(30)。
5.一种如权利要求4所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于,包括以下步骤:
S1、配置并运行定时增量模块(10),定时增量模块(10)获取无线城市大数据的定时增量数据,将定时增量数据存储至存储模块(30)中的关系型Mysql数据库;
S2、配置并运行抽取匹配模块(20),所述抽取匹配模块(20)读取定时增量模块(10)中的定时增量数据,对所述定时增量数据进行抽取匹配,得到匹配数据,并将所述匹配数据发送至存储模块(30);
S3、所述存储模块(30)接收并存储来自抽取匹配模块(20)的匹配数据,将匹配数据存储至分析模块(40)中的HDFS文件系统,存储模块(30)将关系型Mysql数据库中的定时增量数据存储至非关系型Hive数据库;
S4、所述分析模块(40)读取并分析存储于HDFS文件系统中的匹配数据得到分析前的数据,运用无线城市大数据计算框架对分析前的数据进行数据分析得到分析后的数据;
将所述分析前的数据存储至非关系型Hive数据库中,将所述分析后的数据存储至关系型Mysql数据库中;
S5、所述统计模块(50)统计并展示分析后的数据。
6.如权利要求5所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于:步骤S1中的配置并运行定时增量模块(10)是根据cron表达式的时间设定方式,来配置定时增量模块(10)的定时运行方式,所述定时增量模块(10)的定时运行方式包括设置每天定时定点运行、设置间隔t时间运行一次。
7.如权利要求6所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于:步骤S2中的配置并运行抽取匹配模块(20)是通过正则表达式匹配的方式,匹配出需要保留的信息或者匹配出需要删除的信息。
8.如权利要求7所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于:步骤S3中的所述匹配数据是按照缓存队列中依次排队的机制存储至HDFS文件系统。
9.如权利要求8所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于,步骤S4中的运用无线城市大数据计算框架对分析前的数据进行数据分析得到分析后的数据的具体操作步骤包括:将分析前的数据运用大数据处理工具Hive进行数据处理,得到中间处理文件,根据中间处理文件不同的业务需求,编写相应的MapReduce程序。
10.如权利要求9所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于:所述分析前的数据包括图片文件、操作日志文件、域名流量日志、协议维度流量日志、行为日志、基本流量日志、基本时长日志、通道流量日志、准入访问日志。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽四创电子股份有限公司,未经安徽四创电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711044154.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于超图的半监督视觉搜索重排的方法
- 下一篇:企业信息搜索方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置