[发明专利]无线城市大数据离线处理系统及其大数据离线处理方法在审

专利信息
申请号: 201711044154.0 申请日: 2017-10-31
公开(公告)号: CN107908683A 公开(公告)日: 2018-04-13
发明(设计)人: 余保华;邓惠元;范联伟;徐圣吉;展昭;张金国;吴磊;胡鸿超 申请(专利权)人: 安徽四创电子股份有限公司
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 合肥和瑞知识产权代理事务所(普通合伙)34118 代理人: 王挺
地址: 230088 安徽省合肥*** 国省代码: 安徽;34
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 无线 城市 数据 离线 处理 系统 及其 方法
【权利要求书】:

1.无线城市大数据离线处理系统,其特征在于:包括定时增量模块(10)、抽取匹配模块(20)、存储模块(30)、分析模块(40)以及统计模块(50),其中,

定时增量模块(10),用于获取无线城市大数据的定时增量数据;

抽取匹配模块(20),用于读取所述定时增量模块(10)获取到的定时增量数据,并对所述定时增量数据进行抽取匹配,得到匹配数据;

存储模块(30),用于接收并存储来自抽取匹配模块(20)的匹配数据;

分析模块(40),用于读取并分析存储于存储模块(30)中的匹配数据;

统计模块(50),用于统计并展示所述分析模块(40)分析后的匹配数据。

2.如权利要求1所述的无线城市大数据离线处理系统,其特征在于:所述存储模块(30)包括数据内容库和数据来源库;所述数据内容库按照键值的方式存储匹配数据的内容,所述数据来源库用于存储匹配数据的来源。

3.如权利要求2所述的无线城市大数据离线处理系统,其特征在于:所述分析模块(40)运用无线城市大数据计算框架分析存储于存储模块(30)中的匹配数据。

4.如权利要求3所述的无线城市大数据离线处理系统,其特征在于:所述定时增量模块(10)和抽取匹配模块(20)构成了本大数据离线处理系统的业务层;所述业务层由功能层提供数据支持和决策依据,所述功能层包括统计模块(50);所述功能层由平台层提供软件基础,所述平台层包括分析模块(40);所述平台层由基础层提供大数据离线处理环境,所述基础层包括存储模块(30)。

5.一种如权利要求4所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于,包括以下步骤:

S1、配置并运行定时增量模块(10),定时增量模块(10)获取无线城市大数据的定时增量数据,将定时增量数据存储至存储模块(30)中的关系型Mysql数据库;

S2、配置并运行抽取匹配模块(20),所述抽取匹配模块(20)读取定时增量模块(10)中的定时增量数据,对所述定时增量数据进行抽取匹配,得到匹配数据,并将所述匹配数据发送至存储模块(30);

S3、所述存储模块(30)接收并存储来自抽取匹配模块(20)的匹配数据,将匹配数据存储至分析模块(40)中的HDFS文件系统,存储模块(30)将关系型Mysql数据库中的定时增量数据存储至非关系型Hive数据库;

S4、所述分析模块(40)读取并分析存储于HDFS文件系统中的匹配数据得到分析前的数据,运用无线城市大数据计算框架对分析前的数据进行数据分析得到分析后的数据;

将所述分析前的数据存储至非关系型Hive数据库中,将所述分析后的数据存储至关系型Mysql数据库中;

S5、所述统计模块(50)统计并展示分析后的数据。

6.如权利要求5所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于:步骤S1中的配置并运行定时增量模块(10)是根据cron表达式的时间设定方式,来配置定时增量模块(10)的定时运行方式,所述定时增量模块(10)的定时运行方式包括设置每天定时定点运行、设置间隔t时间运行一次。

7.如权利要求6所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于:步骤S2中的配置并运行抽取匹配模块(20)是通过正则表达式匹配的方式,匹配出需要保留的信息或者匹配出需要删除的信息。

8.如权利要求7所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于:步骤S3中的所述匹配数据是按照缓存队列中依次排队的机制存储至HDFS文件系统。

9.如权利要求8所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于,步骤S4中的运用无线城市大数据计算框架对分析前的数据进行数据分析得到分析后的数据的具体操作步骤包括:将分析前的数据运用大数据处理工具Hive进行数据处理,得到中间处理文件,根据中间处理文件不同的业务需求,编写相应的MapReduce程序。

10.如权利要求9所述的无线城市大数据离线处理系统的大数据离线处理方法,其特征在于:所述分析前的数据包括图片文件、操作日志文件、域名流量日志、协议维度流量日志、行为日志、基本流量日志、基本时长日志、通道流量日志、准入访问日志。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽四创电子股份有限公司,未经安徽四创电子股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201711044154.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top