[发明专利]一种基于大数据的电信客户标签生成系统在审
申请号: | 202211621801.0 | 申请日: | 2022-12-16 |
公开(公告)号: | CN115878802A | 公开(公告)日: | 2023-03-31 |
发明(设计)人: | 谢崴;吴志斌;张景双;张棣;刘育楠;蔡景文 | 申请(专利权)人: | 天讯瑞达通信技术有限公司 |
主分类号: | G06F16/35 | 分类号: | G06F16/35 |
代理公司: | 北京清控智云知识产权代理事务所(特殊普通合伙) 11919 | 代理人: | 钟平 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 电信 客户 标签 生成 系统 | ||
本发明提供了一种基于大数据的电信客户标签生成系统,其特征在于,包括数据记录模块、数据处理模块、标签生成模块,所述数据记录模块用于记录用户在使用电信服务时产生的原始数据,所述数据处理模块对每个用户的原始数据进行计算处理,所述标签生成模块根据所有用户的处理结果生成对应的标签;本系统基于时间和业务对原始数据进行预处理,将预处理后的结果与其他用户的预处理结果进行对比分析处理,使得最终得到标签更加具有针对性。
技术领域
本发明涉及电数字数据处理领域,具体涉及一种基于大数据的电信客户标签生成系统。
背景技术
电信:指利用电子技术在不同的地点之间传递信息,电信包括不同种类的远距离通讯方式,例如:无线电,电报,电视,电话,数据通讯以及计算机网络通讯等,电信是信息化社会的重要支柱,无论是在人类的社会、经济活动中,还是在人们日常生活的方方面面,都离不开电信这个高效、可靠的手段,为了能够更好地提供电信服务,需要给用户生成标签,基于标签改善服务,但现有的电信标签系统往往比较简易,针对原始数据简单处理后直接得到标签,不具有针对性,标签起到的作用也随之降低。
背景技术的前述论述仅意图便于理解本发明。此论述并不认可或承认提及的材料中的任一种公共常识的一部分。
现在已经开发出了很多标签系统,经过我们大量的检索与参考,发现现有的标签系统有如公开号为CN105930446B所公开的系统,这些系统一般用分布式文件系统HDFS对电信客户标签数据源进行管理,获取用户个性化特征的各种标签窄表,运用IMSI号关联所有客户的所有标签窄表,得到统一客户标签宽表;将客户标签保存到Hbase,运用Phoenix提供用户标签信息检索入口。但该系统对原始数据的处理方式仍较为简易,得到的标签具有直观性但缺少针对性。
发明内容
本发明的目的在于,针对所存在的不足,提出了一种基于大数据的电信客户标签生成系统。
本发明采用如下技术方案:
一种基于大数据的电信客户标签生成系统,包括数据记录模块、数据处理模块、标签生成模块,所述数据记录模块用于记录用户在使用电信服务时产生的原始数据,所述数据处理模块对每个用户的原始数据进行计算处理,所述标签生成模块根据所有用户的处理结果生成对应的标签;
所述数据记录模块记录的每个用户的数据包括用户基础信息、用户所在区域、访问时间、访问时间分布、业务使用、流量消耗量、业务流量占有量;
所述数据处理模块包括数据调取单元、时间处理单元、业务处理单元、用户存储单元,所述数据调取单元从所述数据记录模块中获取一个用户的数据并为该用户创建一个中间IP,所述时间处理单元对访问时间和访问时间分布数据进行计算处理,所述业务处理单元对业务使用、流量消耗量和业务流量占有量进行计算处理,所述用户存储单元以中间IP作为识别名称创建存储区域保存用户所在区域、时间处理结果和业务处理结果;
所述标签生成模块从所述用户存储单元中获取具有相同用户所在区域的中间IP的保存信息进行分析生成标签;
进一步的,所述时间处理单元对一个用户的数据处理得到三项内容:时间段编号、分析日编号和时间长度分段编号,所述时间段编号用于表示用户在一天时间内的使用时间特征,所述分析日编号用于表示用户的使用日期特征,所述时间长度分段编号用于表示用户单次使用时长特征;
进一步的,所述标签生成模块根据一个用户记录在用户存储单元中的编号信息计算得到任意两个编号的标签指数,并将标签指数从大到小排序,选择前n个标签指数对应的两个编号生成一个标签作为所选用户的标签;
进一步的,所述标签生成模块生成标签指数的过程包括如步骤:
S21、将编号信息转换成二进制数BIP,每个值为1的数位对应于一个保存的编号;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天讯瑞达通信技术有限公司,未经天讯瑞达通信技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211621801.0/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置