[发明专利]一种基于通信网的重要用户发现及行为预测方法有效
申请号: | 202110541915.3 | 申请日: | 2021-05-18 |
公开(公告)号: | CN113395172B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 李艳斌;李淳;刘峤;李银强;代婷婷;周乐;宋明慧;曾义夫;孙建强;曾维智;蓝天;吴祖峰 | 申请(专利权)人: | 中国电子科技集团公司第五十四研究所;电子科技大学 |
主分类号: | H04L41/147 | 分类号: | H04L41/147;H04L41/142 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 罗江 |
地址: | 050000 河北*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 通信网 重要 用户 发现 行为 预测 方法 | ||
1.一种基于通信网的重要用户发现及行为预测方法,其特征在于:包括以下步骤:
步骤1、依据用户通信记录,构建出用户的通信网络,利用基于社区划分的关键节点查找方法,查找网络中的重要节点,挖掘出重要用户;
步骤2、依据用户通信记录,提取出用户通信时间的特征,构建折线图,挖掘出全局通信时间的规律;
步骤3、依据用户通信记录,构建用户的历史通信对象序列,对于挖掘出的重要用户,利用NARM模型,预测出用户下一刻通信对象;
步骤4、基于以上3步的输出结果,筛选出未来时间中重要用户的通信时间和通信对象的预测结果,从而得出重要用户及行为趋势的预测结果;
步骤1中使用基于平衡树的Fast-Newman算法对网络进行社区划分,然后再对每个社区,单独利用PageRank算法进行关键点查找,最后综合社区划分和PageRank算法得出每个节点的重要性,具体过程包括如下步骤:
步骤1-1:根据某个时间段内用户通信记录下的主叫用户和被叫用户信息,提取出该时间段内的所有用户集合及用户集合个数;
步骤1-2:在步骤1-1的基础上,以用户集合中的每个用户作为用户通信网络中的节点,并根据用户通信记录中的主叫号码、被叫号码、主叫、被叫信息,建立通信网络中的节点间通信的边,其中用户通信网络为无向图G(V,E);在G(V,E)中允许两个节点间存在多条边;
步骤1-3:依据用户通信网络的拓扑结构,利用Fast-Newman算法对网络进行社区划分,首先初始化每个节点为一个社区,网络一共N个节点则共有N个社区;模块度Q=0,初始化euv:
如果节点u和v之间有连边:其中m为无向图总的边数,其中tot为节点u和v之间的边的数量;
如果节点u和v之间没有连边:euv=0;
并且au满足:
au=ku/2m;其中ku表示与节点u相连的边的数量;
把网络中的每一条无向边,拆分成两条有向边,euv表示节点u与节点v相连的边的数量占整个网络的比例,au表示与节点u相连的边占整个网络的比例;
步骤1-4:对于有边联系的两个节点u和v比作两个社区,将两个节点合并为一个新的节点即形成一个新的社区,并根据下式计算合并后模块度的增量:
ΔQ=euv+evu-2auav=2(euv-auav);
根据Fast-Newman算法的原理,需要找到模块度Q最大时对应的网络节点合并情况,因此采用贪心原理,每次选择产生最大ΔQ的两个节点进行合并,并且记录下每次合并的节点;对于每两个有边联系的两个节点新建一条边,并将边权设置为2(euv-auav),并且将这些边按照边权的大小插入平衡树中;
步骤1-5:开始合并两个节点,根据平衡树的性质容易得到最大的边权的边,将边权最大的边的两个端点的节点u和v进行合并同时将边从平衡树中进行删除,并记录下合并记录,合并后的新的聚合节点为z,那么新节点的属性如下:
ezz=euu+evv+euv+evu;
ezx=eux+evx;
az=au+av;
其中x为除z,u,v之外的并且与u和v相连的节点,把网络中的每一条无向边,拆分成两条有向边,则ezz表示合成的节点z中的边数占原始整个无向图中的比例;
根据步骤1-4计算模块度的增量,将合并前的与u和v相连的边并且在平衡树中的边进行删除,然后根据新合并的节点z的属性重新设置新的边及计算新的边权,再插入到平衡树中;
步骤1-6:重复步骤1-5的操作N-1次,这时就只剩下一个合并后的新节点,然后根据最大的Q值所对应的节点合并步骤,将整个图的n个点当作n个单独的联通块,使用并查集模拟这个过程,把最终每一个联通块看成一个社区,即可得到最大的Q值对应的社区划分;
步骤1-7:根据社区划分的结果图G(V,E)被划分为G1,G2,...,Gk,其中k为社区数量,子图Gi(Vi,Ei)表示一个社区,其中Vi表示社区内的节点,Ei表示社区的内部关系并且Ei两个端点都在子图Gi内,并且V1∪V2∪...∪Vk=V;将Gi聚合成一个超级节点si,构建超级节点的邻接矩阵S,S的元素Sij表示社区i和j之间的连边的权重之和,由于无向图G为非带权图,所以邻接矩阵的连边的权重便是两个社区的连边总数:
Sij=Tij;
Tij为社区i和社区j的连边总数,当i=j时为同一个社区,此时Tij为社区内部边的数量的两倍;
步骤1-8:求取各节点在各自社区内的PageRank值,利用PageRank算法对每个子图的每一个节点计算其PageRank值:
其中,y表示与x在同一社区的节点,如果y和x直接相连,则σ(x,y)值为1,否则为0,ky表示y节点在子图Gi内的出度,PR’(x)为x在上一时间段所在社区的PageRank值,初始为零;对于不同社区,采用多路计算的方式,分摊到多个线程进行计算;
步骤1-9:定义一个衡量社区内部连结关系和外部连结关系的数值,社区i的连结系数;定义为社区的内部度即与外界相连的边,为社区的外部度即社区内部的边,则根据S矩阵可得:
定义社区i的连结系数为Ii,采用如下公式进行计算:
接下来对社区连结系数进行归一化处理,使用softmax函数进行归一化;
其中是社区x被选择的概率,k为社区数量;
步骤1-10:计算每个节点重要程度;将每一个节点利用综合公式计算Rank值在进行排序,对于节点x的Rank值计算如下:
其中Gx为x所在的社区,|Gx|为x所在社区的大小;通过计算,将所有的节点的Rank值进行排序,可以得到整个网络的节点的重要性排序,选取Rank值最大的节点或者前几个节点,就可以挖掘出网络中的一个或多个重要用户。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子科技集团公司第五十四研究所;电子科技大学,未经中国电子科技集团公司第五十四研究所;电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110541915.3/1.html,转载请声明来源钻瓜专利网。