[发明专利]一种基于Hadoop的移动互联网用户行为分析方法有效
申请号: | 201710189942.2 | 申请日: | 2017-03-27 |
公开(公告)号: | CN106982150B | 公开(公告)日: | 2020-05-26 |
发明(设计)人: | 侯静;陈敏俊;温亮生;张治中 | 申请(专利权)人: | 重庆邮电大学;中移(杭州)信息技术有限公司 |
主分类号: | H04L12/26 | 分类号: | H04L12/26;G06F16/9535 |
代理公司: | 北京同恒源知识产权代理有限公司 11275 | 代理人: | 赵荣之 |
地址: | 400065 *** | 国省代码: | 重庆;50 |
权利要求书: | 暂无信息 | 说明书: | 暂无信息 |
摘要: | 本发明涉及一种基于Hadoop的移动互联网用户行为分析方法,所述方法包括:2G/3G/LTE网络数据采集步骤;协议栈解析步骤;实时DPI业务识别步骤;网络爬虫步骤;二次DPI业务识别步骤;以及数据挖掘步骤。本发明提供的一种基于Hadoop的移动互联网用户行为分析方法,能够解决当前电信运营商的流量经营方案单一、数据处理效率低下的问题。 | ||
搜索关键词: | 一种 基于 hadoop 移动 互联网 用户 行为 分析 方法 | ||
【主权项】:
一种基于Hadoop的移动互联网用户行为分析方法,其特征在于,所述方法包括:2G/3G/LTE网络数据采集:通过采集卡从2G/3G/LTE网络接口采集移动互联网用户在网络中从事活动的原始信令数据与业务数据,并将所述原始信令数据与所述业务数据导入到分布式文件系统HDFS,以通过HDFS提供数据访问业务;协议栈解析:将所述原始信令数据与所述业务数据翻译为具有逻辑意义的数据结构的业务流,为深度包检测DPI业务识别提供上下文;实时DPI业务识别:对所述业务流中的指定报文数据进行信息检测,以识别所述业务流所承载的应用类型;网络爬虫:通过爬虫程序定向抓取互联网中的信息,所述信息包括视频业务的名称、类型,并将抓取的信息保存到DPI特征库中;二次DPI业务识别:基于爬虫所建立的DPI特征库,通过正则表达式从URL中获取关键值,并与所述DPI特征库进行匹配,以获取移动互联网用户的详细信息,并将所述用户的详细信息导入到Hive;数据挖掘:在Hive中进行数据分析及预处理,并通过Mahout/Spark组件对所述用户的详细信息进行聚类分析、分类预测、推荐以及关联分析,并导出结果数据,以实现电信运营商的客户关系管理及市场推广应用。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学;中移(杭州)信息技术有限公司,未经重庆邮电大学;中移(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710189942.2/,转载请声明来源钻瓜专利网。