[发明专利]基于海量用户行为数据的高速计算分析方法在审
| 申请号: | 201410345089.5 | 申请日: | 2014-07-18 |
| 公开(公告)号: | CN105302831A | 公开(公告)日: | 2016-02-03 |
| 发明(设计)人: | 李馥岑;孙鑫;张旭明 | 申请(专利权)人: | 上海星红桉数据科技有限公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 200241 上海市*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明主要解决的是面对越来越灵活的双向新媒体业务,面对百万级,甚至千万级用户的海量行为数据,将采集到的用户行为数据进行HDFS分布式存储,经过ETL模块对数据进行提取、转换和加载之后,由符合传媒行业特点的优化组合算法模块,将海量的用户行为数据进行高效的数据预处理,形成一系列的中间结果数据,再通过不同的WEB应用程序调用相关的中间结果数据集,以实现对海量用户行为数据的高速分析运算,为运营商提供秒级的实时计算分析。 | ||
| 搜索关键词: | 基于 海量 用户 行为 数据 高速 计算 分析 方法 | ||
【主权项】:
一种基于海量用户行为数据的高速计算分析方法,其特征在于:包含如下步骤:A、首先采集运营商的海量用户行为数据及第三方系统的异构数据;B、通过HDFS分布式存储模块进行三备份分布式存储;C、通过ETL模块完成对海量行为数据的提取、转化及加载;D、然后再由算法处理模块对转化后的海量行为数据通过优化组合的算法包及数据模型进行数据预处理操作,最终形成一系列的中间结果数据,并存储在中间结果数据存储模块中;E、通过不同的WEB应用程序由操作用户提交分析请求,直接从中间结果数据存储模块中调用所需的指标数据,并通过运算即可完成对用户分析请求的结果反馈。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海星红桉数据科技有限公司,未经上海星红桉数据科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201410345089.5/,转载请声明来源钻瓜专利网。
- 上一篇:网页标签的关闭方法和系统
- 下一篇:一种加载图片的方法、装置及系统





