[发明专利]“黑卡”识别方法、电子设备及计算机可读取存储介质有效
申请号: | 201811390723.1 | 申请日: | 2018-11-21 |
公开(公告)号: | CN109640312B | 公开(公告)日: | 2021-09-14 |
发明(设计)人: | 夏玉明;魏国富;殷钱安;汲丽;梁淑云;陶景龙;徐明 | 申请(专利权)人: | 上海观安信息技术股份有限公司 |
主分类号: | H04W8/18 | 分类号: | H04W8/18;H04W12/06;H04W12/126 |
代理公司: | 北京新知远方知识产权代理事务所(普通合伙) 11397 | 代理人: | 马军芳;刘玲 |
地址: | 200333 上海市浦东新*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 识别 方法 电子设备 计算机 读取 存储 介质 | ||
1.一种“黑卡”识别方法,其特征在于,包括:
获取原始数据,并对所述原始数据进行处理,形成以电话号码为唯一标识的识别数据,所述识别数据包括状态正常的电话号码的运营商客户表、产品表、销售品表、账单表、缴费日志表、通话短信记录表、基站信令表、电渠接口调用表、电渠登录日志表;
对所述识别数据进行异常检测,确定每个电话号码的异常标签,所述异常标签用于表征所述电话号码是否为疑似异常号码;
将异常标签加入对应电话号码所标识的识别数据后,根据加入异常标签的识别数据构建无向图,包括:基于加入异常标签的识别数据,将每个电话号码以及每个电话号码对应的登录IP均作为点;将每个电话号码与其对应的登录IP之间构建一条边,且该边的权重为该电话号码对应的异常属性的值;所有的点和边形成无向图;
根据所述无向图识别各电话号码是否为“黑卡”,包括:计算每个登录IP对应的点的异常程度;将异常程度大于预设阈值的点确定为疑似异常点;根据所述疑似异常点确定异常的电话号码;将异常的电话号码确定为“黑卡”,以及将异常标签为表征疑似异常号码的电话号码确定为“黑卡”。
2.根据权利要求1所述的方法,其特征在于,所述获取原始数据,包括:
获取运营商客户资料数据、产品数据、销售品数据、近n个月的账单数据、缴费日志数据、通话短信记录数据、基站信令数据、电渠接口调用数据、电渠登录日志数据,其中,n为预设的正整数值;
所述对所述原始数据进行处理,形成以电话号码为唯一标识的识别数据,包括:
从所述运营商客户资料数据中提取状态正常的电话号码和所述状态正常的电话号码所对应的第一属性信息,并根据所述状态正常的电话号码和第一属性信息,生成以状态正常的电话号码为唯一标识的运营商客户表;所述第一属性信息包括:用户姓名、证件类型、用户年龄、性别、证件归属地、证件对应的有效手机号码数、帐户、账户对应的有效手机号码数、所属客户编码、所属客户编码对应的有效手机号码数;
从所述产品数据中提取所述状态正常的电话号码对应的第二属性信息,并根据所述状态正常的电话号码和第二属性信息,生成以状态正常的电话号码为唯一标识的产品表;所述第二属性信息包括:号码头是否新号段、虚拟网号段、是否近1月入网、是否近3月入网、是否近6月入网、网龄、开卡受理人、开卡受理营业厅、是否代理商、代理商标识、号码等级、是否开通语音功能、是否开通上网功能;
从所述销售品数据中提取所述状态正常的电话号码对应的第三属性信息,并根据所述状态正常的电话号码和第三属性信息,生成以状态正常的电话号码为唯一标识的销售品表;所述第三属性信息包括:对应套餐的套餐类型、套餐档次、是否加装增值业务、套餐下有效手机号码数;
从所述账单数据中提取所述状态正常的电话号码对应的第四属性信息,并根据所述状态正常的电话号码和第四属性信息,生成以状态正常的电话号码为唯一标识的账单表;所述第四属性信息包括:各月出账金额、n个月的平均账单金额、是否欠费、欠费金额、欠费月数;
从所述缴费日志数据中提取所述状态正常的电话号码对应的第五属性信息,并根据所述状态正常的电话号码和第五属性信息,生成以状态正常的电话号码为唯一标识的缴费日志表;所述第五属性信息包括:6个月内的缴费次数、平均每次缴费金额、缴费方式、缴费渠道、缴费金额的变异系数;
从所述通话短信记录数据中提取所述状态正常的电话号码对应的第六属性信息,并根据所述状态正常的电话号码和第六属性信息,生成以状态正常的电话号码为唯一标识的通话短信记录表;所述第六属性信息包括:n个月内的主叫总时长、主叫次数、主叫号码数、主叫号码离散度、被叫时长、被叫次数、被叫号码数、被叫号码离散度;
从所述基站信令数据中提取所述状态正常的电话号码对应的第七属性信息,并根据所述状态正常的电话号码和第七属性信息,生成以状态正常的电话号码为唯一标识的基站信令表;所述第七属性信息包括:1个月内的接入基站总数、基站标识、每天接入基站数的标准差、每天接入基站数的平均值、基站接入数的变异系数、最常接入基站信息;
从所述电渠接口调用数据中提取所述状态正常的电话号码对应的第八属性信息,并根据所述状态正常的电话号码和第八属性信息,生成以状态正常的电话号码为唯一标识的电渠接口调用表;所述第八属性信息包括:状态正常的电话号码的操作频数、最小的每个状态正常的电话号码每种操作类型两次操作间隔、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数、每个状态正常的电话号码每种操作类型以相同操作间隔的最大连续次数、每个状态正常的电话号码每种操作类型的最小操作间隔的最大连续次数、最小的每个状态正常的电话号码每种操作类型两次操作间隔的操作次数占比;
从所述电渠登录日志数据中提取所述状态正常的电话号码对应的第九属性信息,并根据所述状态正常的电话号码和第九属性信息,生成以状态正常的电话号码为唯一标识的电渠登录日志表;所述第九属性信息包括:用户登录次数、一天内登录小时数、登录设备标识、登录IP数、同一登录IP下的最大曾登录手机号码数、同一登录设备下的最大曾登录手机号码数;
以所述状态正常的电话号码为唯一标识,将运营商客户表、产品表、销售品表、账单表、缴费日志表、通话短信记录表、基站信令表、电渠接口调用表、电渠登录日志表整合成一张表,并将整合后的表作为以电话号码为唯一标识的识别数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海观安信息技术股份有限公司,未经上海观安信息技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811390723.1/1.html,转载请声明来源钻瓜专利网。