[发明专利]一种大数据分析系统在审

专利信息
申请号: 201710267379.6 申请日: 2017-04-21
公开(公告)号: CN107038608A 公开(公告)日: 2017-08-11
发明(设计)人: 李长青;孙鹏;王丽霞;李志文;董艳华 申请(专利权)人: 北京恒冠网络数据处理有限公司
主分类号: G06Q30/02 分类号: G06Q30/02;G06F17/30
代理公司: 北京恒冠智创知识产权代理有限公司11543 代理人: 陈红
地址: 100070 北京市丰台区汽车博*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种大数据分析系统,包括收集分析系统和数据存放系统;所述收集分析系统设置有搜索引擎、第一标记模块、过滤系统、临时数据存放模块、数据输入模块、比对模块、过滤模块、数据采集模块、编译模块、数据库、网络服务器、计算模块、对比模块、storm拓扑结构架构、操作系统、调取模块、广告数据库和客户端;所述搜索引擎为收集分析系统的开始端口;所述第一标记模块设置在搜索引擎数据的输出线路上;本发明公布的搜索引擎便于使用者输入关键词,进行相关信息搜索;数据采集模块将搜索的关键词收集起来,便于后续处理;编译模块将收集的数据转换为计算机语言,便于计算机系统进行处理;每个数据库用于对应存放标记有不同符号的数据。
搜索关键词: 一种 数据 分析 系统
【主权项】:
一种大数据分析系统,包括收集分析系统和数据存放系统;其特征于,所述收集分析系统设置有搜索引擎、第一标记模块、过滤系统、临时数据存放模块、数据输入模块、比对模块、过滤模块、数据采集模块、编译模块、数据库、网络服务器、计算模块、对比模块、storm拓扑结构架构、操作系统、调取模块、广告数据库和客户端;所述搜索引擎为收集分析系统的开始端口,搜索引擎便于使用者输入关键词,进行相关信息搜索;所述第一标记模块设置在搜索引擎数据的输出线路上,第一标记模块用于将每个网络IP地址输出的数据标记一个特别的符号;所述过滤系统设置在第一标记模块的数据输出端,过滤系统用于阻碍个人搜索时搜索的不良信息数据;所述临时数据存放模块连接着第一标记模块的数据输出端,临时数据存放模块用于短暂存放通过的数据,便于对数据进行分析;所述数据输入模块设置在过滤系统的输入端口,数据输入模块便于工作人员提前输入需要过滤的不良信息数据;所述比对模块连接在临时数据存放模块和数据输入模块之间,比对模块用于将临时数据存放模块和数据输入模块中的数据进行对比,从而标记出临时数据存放模块中的不良信息数据;所述过滤模块设置在比对模块的数据输出端口处且过滤模块的输出端连接着数据采集模块,过滤模块用于将比对模块中标记的不良信息数据过滤掉,避免后续数据分析产生问题;所述数据采集模块设置在第一标记模块的数据输出端口处,数据采集模块将搜索的关键词收集起来,便于后续处理;所述编译模块设置在数据采集模块的数据输出端口处,编译模块将收集的数据转换为计算机语言,便于计算机系统进行处理;所述数据库的数量对应于网络IP地址的数量,处于编译模块的数据输出端口处,每个数据库用于对应存放标记有不同符号的数据;所述数据库选择为Mysql数据库,Mysql数据库开放性强,便于工作人员随时修改数据库内的数据,避免不良信息过多;所述网络服务器设置在数据库之间,网络服务器用于将各个数据库联系在一起,便于将各个数据库的数据汇集处理,再反馈到每个数据库中,节约处理时间;所述网络服务器为Apache服务器,Apache服务器易于外界对数据库进行访问操作,便于管理者对数据库中的数据进行其他方面的使用;所述计算模块设置在网络服务器的数据输出端口处,计算模块采用平均值计算规则,将关键词出现的次数除以对应天数,得到数值,公式为L=N/T,其中L为比值数字,N为关键词出现次数,T为从第一次出现后过的天数;所述对比模块设置在计算模块的数据输出端口,对比模块用于对比每种标记的各个关键词的计算比值,输出最大比值的关键词;所述storm拓扑结构架构设置在对比模块的数据输出端口处,storm拓扑结构架构用于矫正对比模块在对比数据过程中发生错误,对其进行矫正;所述操作系统设置在网络服务器的另一个数据输出端口处,操作系统用于从各个数据库中调取处理过后的数据;所述操作系统选择为Linux系统,Linux系统便于不同客户以各自的访问权限访问,互不影响;所述调取模块设置在操作系统的输出端口处,调取模块根据操作系统中提取出的数据调取相关的广告,发送至相对应的网络IP地址,实现人性化的广告推送;所述广告数据库与调取模块相连通,广告数据库便于调取模块调取相对应的广告;所述客户端设置在调取模块的数据输出端口处,一个网络IP地址对应一个客户端,便于每个客户端得到相应的广告推送;所述;所述数据存放系统设置有数据库、第二标记模块、第一存储模块、第二存储模块和累加模块;所述第二标记模块设置在每个数据库的网络服务器反馈端口,第二标记模块将处理过的数据再次标记一次,便于与数据库内未处理的数据分开;所述第一存储模块设置在每个数据库内,第一存储模块用于存放未处理的数据;所述第二存储模块设置在每个数据库内,第二存储模块用于存放已处理过的数据;所述累加模块设置在第一存储模块处,累加模块用于计数关键词出现的次数,并且每过二十四小时,为公式L=N/T中的天数T加一,提供数据分析的准确度。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京恒冠网络数据处理有限公司,未经北京恒冠网络数据处理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201710267379.6/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

400-8765-105周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top