[发明专利]一种基于电信大数据的家庭成员识别聚类方法在审
申请号: | 201910012306.1 | 申请日: | 2019-01-07 |
公开(公告)号: | CN109784393A | 公开(公告)日: | 2019-05-21 |
发明(设计)人: | 阮志强;徐戈;邵振华 | 申请(专利权)人: | 闽江学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 厦门原创专利事务所(普通合伙) 35101 | 代理人: | 徐东峰 |
地址: | 350108 福建*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 成员识别 目标用户 通信连接 大数据 聚类 时长 通话 干扰因素 孤立节点 关系确定 合并处理 技术效果 通信联系 统计周期 消费信息 信令位置 营销效率 用户节点 准确定位 电信 管控 权重 套餐 群体 剔除 近似 证件 营销 探索 | ||
本发明公开了一种基于电信大数据的家庭成员识别聚类方法。包括:从通话频次、通信连接位置等信息,探索家庭成员之间的通信联系特征,以统计周期作为计算时长,利用通信连接信令位置信息,分别计算用户与其他用户夜间共宿地累计时长,建立两个节点之间的边权模型,同证件的两个用户节点加大关系权重,确定边权阈值,以选取出家庭群体的核心成员,根据用户与已确定成员间存在通话比例和一定阈值的关系确定家庭成员,最后将高度近似的家庭群体进行合并处理,并剔除孤立节点联系等干扰因素。该方法解决了现有技术中根据套餐及用户消费信息进行目标用户定位不准确,营销效率低的技术问题。达到了准确定位目标用户,有效管控营销资源的技术效果。
技术领域
本发明关于一种基于电信大数据的家庭成员识别聚类方法。
背景技术
电信运营商传统宽带、家庭网产品套餐发展方法,主要存在两个不足:(1) 根据套餐办理情况及用户消费信息进行目标用户定位,目标用户不准确,营销效率低;(2)发展过程中,发展目标的健康度(即,是否为可发展对象/发展可能性大小)无法判定,营销资源无法有效管控,形成浪费。分析以上两个不足,电信运营商宽带、家庭网产品需以精确的家庭成员数据为依托,构建家庭成员识别聚类模型凸显迫切。本发明探索用户交往圈通话习惯、通信连接位置信息、身份信息等各维度关系,发现家庭成员间的以上维度信息存在一定聚类效果。
发明内容
鉴于上述情况,有必要提供一种基于电信大数据的家庭成员识别聚类方法,可以有效解决上述问题。
本发明提供一种基于电信大数据的家庭成员识别聚类方法,从时间、通话频次、通信连接位置、交往圈、身份信息,探索家庭成员之间的通信联系特征,包括以下步骤:
以具有稳定联系特点的交往圈为数据基础,需完成数据筛选;
以一个统计时间段为计算时长,利用通信连接信令位置信息,分别计算用户与交往圈其他用户夜间共宿地累计时长,建立两个节点之间的家庭成员关系的边权模型,以反映两者属于同一家庭的概率;
优化边权模型,同证件的两个用户节点加大关系权重;
基于边权模型进行边权统计分析,确定边权阈值,以选取出家庭群体的核心成员;
计算交往圈中未确定为家庭成员的用户与已确定成员间存在通话关系比例,比例大于一定阈值,则确定为家庭成员;
将高度近似的家庭群体进行合并处理,并剔除孤立节点联系等干扰因素。
附图说明
图1一种基于电信大数据的家庭成员识别聚类方法的实施步骤图;
图2用户边权模型图;
图3全网模型训练步骤图;
图4用户交往圈数据表及标识;
图5用户通信连接信令信息表及标识;
图6用户实名信息表。
具体实施方式
请参照图1,本发明实施一种基于电信大数据的家庭成员识别聚类方法,包括如下步骤:
S1,进行数据筛选,以具有稳定联系特点的交往圈为数据基础;
S2,以统计周期作为计算时长,利用通信连接信令位置信息,分别计算用户与交往圈其他用户夜间共宿地累计时长,建立两个节点之间的家庭成员关系的边权模型,以反映两者属于同一家庭的概率;
S3,优化边权模型,同证件的两个用户节点加大关系权重;
S4,基于优化后的边权模型进一步进行边权统计分析,确定边权阈值,以选取出家庭群体的核心成员;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于闽江学院,未经闽江学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910012306.1/2.html,转载请声明来源钻瓜专利网。