[发明专利]数据采集及解析方法及系统在审
申请号: | 201610055952.2 | 申请日: | 2016-01-27 |
公开(公告)号: | CN105718295A | 公开(公告)日: | 2016-06-29 |
发明(设计)人: | 唐永瑞;漆尧;杜科 | 申请(专利权)人: | 四川长虹电器股份有限公司 |
主分类号: | G06F9/45 | 分类号: | G06F9/45 |
代理公司: | 成都虹桥专利事务所(普通合伙) 51124 | 代理人: | 李凌峰 |
地址: | 621000 四*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据 采集 解析 方法 系统 | ||
技术领域
本发明涉及终端上报的行为数据的日常采集及解析,特别涉及在Java技术基础上,构建大规模数据的采集及解析。
背景技术
随着智能家电的普及,如何分析用户终端的各项数据,挖掘用户的隐形需求,为用户提供更加丰富、友好的服务,成为各大家电厂商研究的重要方向。基于这些要求,对终端数据的采集和解析,为后续的大数据处理工作提供数据支撑,成为了一项重要的基础工作。
Java技术广泛应用于各大系统平台的软件开发,利用Java技术开发web程序进行数据采集、数据解析,可以跨平台移植,方便进行大规模部署、更新、升级。传统的数据采集、解析方法包括两种:一、数据的实时采集、解析;二、数据的延时采集、解析。实时的数据采集、解析方法由一套web程序提供采集、解析功能,即在数据上报的第一时间触发采集、解析程序,采集到的数据立刻进行解析、存储;延时的数据采集、解析方法的则由采集程序和解析程序构成,采集程序先将终端上报的数据写入到服务器的本地磁盘空间,解析程序扫描本地数据文件,读取数据进行解析处理、存储。
发明内容
本发明所要解决的技术问题,就是提供一种数据采集及解析方法及系统以实现更加快速、可靠的数据采集及解析。
本发明解决所述技术问题,采用的技术方案是,数据采集及解析方法,包括:终端上报数据时,系统采集上报数据,根据预设周期存储至本地磁盘;系统对本地磁盘存储的上报数据进行多线程扫描解析,并将解析数据存储至kafka。
具体的,终端通过post方式上报数据。
具体的,系统采集上报数据,将其转换为String格式的字符串,并将字符串保存在列表中,根据预设周期将列表中的数据写入到本地磁盘。
具体的,系统对本地磁盘存储数据进行多线程扫描解析,每个线程中,系统将String类型的字符串数据转换为json格式的数据,获取各字段值,并对各字段值进行解析。
进一步的,所述对各字段值进行解析包括:获取designation字段值判断解密类型,调用解密程序进行数据解密,得到解密数据;获取ip字段值,调用IP解析程序对IP进行解析,得到IP地址信息及时间信息。
进一步的,系统将解密数据、IP地址信息及时间信息组合成json格式的数据存入kafka,所述kafka存储节点至少为一个。
数据采集及解析系统,包括数据采集接口、本地磁盘、数据解析模块及kafka存储节点;所述数据采集接口与本地磁盘连接,本地磁盘与数据解析模块连接,数据解析模块与kafka存储节点连接;
所述数据采集接口,用于终端上报数据时,采集上报数据,并根据预设周期将上报数据存储至本地磁盘;
所述数据解析模块,用于对本地磁盘存储的上报数据进行多线程扫描解析,并将解析数据存储至kafka。
具体的,终端通过post方式上报数据至数据采集接口。
具体的,数据采集接口采集上报数据,将其转换为String格式的字符串,并将字符串保存在列表中,根据预设周期将列表中的数据写入到本地磁盘。
具体的,数据解析模块对本地磁盘存储的上报数据进行多线程扫描解析,每个线程中,系统将String类型的字符串数据转换为json格式的数据,获取各字段值,并对各字段值进行解析。
进一步的,所述对各字段值进行解析包括:获取designation字段值判断解密类型,调用解密程序进行数据解密,得到解密数据;获取ip字段值,调用IP解析程序对IP进行解析,得到IP地址信息及时间信息。
进一步的,系统将解密数据、IP地址信息及时间信息组合成json格式的数据存入kafka,所述kafka存储节点至少为一个。
本发明的有益效果是:由于数据解析主程序或调用的解密程序、IP解析程序的升级及维护不会影响到数据采集工作的正常进行,所以不会造成数据丢失,保证了采集数据的完整性;快速、可靠的实现对终端上传数据的采集和解析。
附图说明
图1为本发明数据采集及解析方法及系统实施例的流程图。
以下结合实施例的具体实施方式,对本发明的上述内容再作进一步的详细说明。但不应将此理解为本发明上述主题的范围仅限于以下的实例。在不脱离本发明上述技术思想情况下,根据本领域普通技术知识和惯用手段做出的各种替换或变更,均应包括在本发明的范围内。
具体实施方式
下面结合附图及实施例详细描述本发明的技术方案:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于四川长虹电器股份有限公司,未经四川长虹电器股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610055952.2/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置