[发明专利]一种基于电信大数据的家庭成员识别聚类方法在审
申请号: | 201910012306.1 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109784393A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 阮志强;徐戈;邵振华 | 申请(专利权)人: | 闽江学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 厦门原创专利事务所(普通合伙) 35101 | 代理人: | 徐东峰 |
地址: | 350108 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 成员识别 目标用户 通信连接 大数据 聚类 时长 通话 干扰因素 孤立节点 关系确定 合并处理 技术效果 通信联系 统计周期 消费信息 信令位置 营销效率 用户节点 准确定位 电信 管控 权重 套餐 群体 剔除 近似 证件 营销 探索 | ||
1.一种基于基于电信大数据的家庭成员识别聚类方法,其特征在于:
每个手机用户都是电信社交网络中的一个节点,连接两个节点的边的权重代表了彼此的通信联系特征。基于电信大数据来识别家庭群体,就相当于在电信社交网络中识别出符合特定边权条件的多边形子图,从时间、通话频次、通信连接位置、交往圈、身份信息,探索家庭成员之间的通信联系特征,其步骤如下:
以具有稳定联系特点的交往圈为数据基础;
以一个统计时间段为计算时长,利用通信连接信令位置信息,分别计算用户与交往圈其他用户夜间共宿地累计时长,建立两个节点之间的家庭成员关系的边权模型,以反映两者属于同一家庭的概率;
优化边权模型,同证件的两个用户节点加大关系权重;
基于边权模型进行边权统计分析,确定边权阈值,以选取出家庭群体的核心成员;
计算交往圈中未确定为家庭成员的用户与已确定成员间存在通话关系比例,比例大于一定阈值,则确定为家庭成员;
将高度近似的家庭群体进行合并处理,并剔除孤立节点联系等干扰因素。
2.如权利要求1所述的设计方法,其特征在于,利用通话频次确定具有稳定联系特点的交往圈:
剔除近半年存在通话月数小于4的记录(即:CALL_M_CNT<4)
剔除统计月通话次数小于3的记录(即:CALL_CNT<3)
变量见附表。
3.如权利要求1所述的设计方法,其特征在于,首先针对单一用户,读取该用户交往圈信息表,建立关联用户无向网络图,同时,读取该用户及关联用户夜间通信连接信令信息表,根据用户与关联用户夜间共宿地累计时长,更新无向网络图权重,建立关联用户边权模型。算法伪代码如下:
计算出该用户与不同关联用户k间的共宿时长dur_msisdn[k],并将dur_msisdn[k]加入关联用户无向网络图中形成边权模型图。
4.如权利要求1所述的设计方法,其特征在于,优化用户边权模型:
将边权模型中与该用户同身份证号的关联用户权重进行统一增加。该权重足以让所连接的用户确定为家庭成员关系。
5.如权利要求1所述的设计方法,其特征在于,确定阈值并初步确定家庭成员关系网:
取共宿时长大于等于统计时间段1/6(该比例可根据情况修改)天数的关联用户确定为与该用户具有家庭关系的用户,即:归类为“确定成员”,其余关联用户归类为“未确定成员”,伪代码如下:
if dur_misdn[k]>=2100do
关联用户k为“确定成员”
else do
关联用户k为“非确定成员”
注:以上参数基于统计时间段为30天,1天统计时长7小时(仅统计0:00-7:00,420分钟),5天统计时长应为420*5=2100分钟
6.如权利要求1所述的设计方法,其特征在于,因存在家庭成员在统计时段内与其他成员不在同一地点活动(如:出差、外地工作等)或者同一地点接入基站小区不同情况(同住址,不同房间接入基站小区不同)。采用以下算法增量家庭成员聚类,完成家庭成员聚类模型补漏,步骤如下:
上述方法针对“非确定成员j”确定其聚类指标julei[j],若julei[j]/num_q>0.66(此阈值可根据情况更新修正),则将该“非确定成员j”划入“确定成员”。
以此最终确定用户的家庭成员。
7.如权利要求1所述的设计方法,其特征在于,将上述单用户家庭成员关联方法扩展至全网用户家庭成员聚类,即,全网模型训练步骤如下:
若统计时间段内存在n个用户,则需要执行上述单用户家庭成员关联算法n次,形成n个家庭网,最后合并高相似家庭网,并对弱连接家庭网进行处理。
高相似家庭网合并:将家庭网成员完全相同的家庭网进行合并。
弱连接家庭网处理:即两个家庭网之间存在一个或者少数的相同用户,需对这部分少数用户进行判断,比较其与两个家庭成员间的共宿时长、统计时段内通话次数,将用户归入共宿时长较长、通话次数较多的家庭网成员。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910012306.1/1.html,转载请声明来源钻瓜专利网。