[发明专利]一种基于边图随机游走的重叠社区发现方法有效

专利信息
申请号: 201510046401.5 申请日: 2015-01-29
公开(公告)号: CN104537126B 公开(公告)日: 2017-12-01
发明(设计)人: 邓晓衡;李更好;桂劲松;刘安丰;沈海澜;李登 申请(专利权)人: 中南大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 中南大学专利中心43200 代理人: 胡燕瑜
地址: 410083 湖南*** 国省代码: 湖南;43
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供一种基于边图随机游走的重叠社区发现方法,主要包括以下步骤1)根据网络中成员的关系,构建一个相互连接的无向图G,由图G的关联矩阵B可得到有权边图LG的权值矩阵H,有权边图LG中的节点为初始无向图G中的边。2)在有权边图LG上进行长度为T的随机游走,初始转移概率矩阵P根据权值矩阵H得到,无向图G中边之间的相似度为T步内转移概率之和,再将相似度转化为距离,聚类产生边社区。3)定义节点受到边社区的吸引度,找出边社区之间的边缘节点,根据吸引度的阈值δ可对边缘节点划分,最后检测到允许节点重叠的社区。本发明方法简单易行,并且通过调整阈值δ能发现不同重叠程度的社区。
搜索关键词: 一种 基于 随机 游走 重叠 社区 发现 方法
【主权项】:
一种基于边图随机游走的重叠社区发现方法,其特征在于包括以下步骤:步骤1),计算有权边图LG的权值矩阵H,具体步骤如下:步骤1‑1)根据复杂网络中成员与成员之间的关系构建一个相互连接的无向图G=(V,E),V代表成员节点的集合,E代表成员间的边集合;假定网络图中总的节点数为N,边数为M,A=[aij]为无向图G的邻接矩阵,若节点i与节点j相连,则aij=1,反之aij=0;W=[wij]则为无向图G的权值矩阵,其中wij表示无向边(i,j)的权值;节点i的强度si等于与节点i相连的所有边的权值之和,即si=∑jwij;若网络为无向无权图,则W=A,每条边的权值为1;步骤1‑2)对无向图G中的边进行编号,并记录连接关系及权值,建立无向图G的关联矩阵B;关联矩阵B=[biα]是一个N×M的矩阵,元素biα表示边α占节点i强度的大小,计算公式为:步骤1‑3)构建有权边图LG,计算其权值矩阵H:有权边图LG中M个节点代表无向图G的M条边,两点之间的边表示无向图G中相应的两条边有公共顶点;其权值矩阵H=[hαβ]是一个M×M的矩阵,通过关联矩阵B计算得到,计算公式为:其中,节点的强度si=∑jwij=∑αbiα;权值矩阵H是一个对称矩阵且含有自环,表明随机游走者不仅仅可以进行边到边的游走,还可以在一条边的两个端点间游走,更符合实际情况;步骤2),在有权边图LG上进行随机游走,计算有权边图LG中节点之间的距离D,聚类获得边社区CL,具体步骤如下:步骤2‑1)在有权边图LG上进行长度为T的随机游走,计算并记录每一步t的转移概率,1≤t≤T;其中,一步转移概率矩阵P=[pαβ]由权值矩阵H计算而得,计算公式为:步骤2‑2)对T步内的转移概率进行累加,得到无向图G中任意两边的相似度σαβ,其中,[Pt]αβ表示从边α出发经过t步到达边β的转移概率;步骤2‑3)对相似度进行归一化处理,得到无向图G中任意两边的距离dαβ,其中,maxσαβ,minσαβ分别表示最大和最小的距离;步骤2‑4)根据average‑linkage聚类方法对距离进行处理,生成一个有层次的树状图;设定社区数目为q,将网络的边划分成q个子集,即边社区CL={P1,...,Pq};随机游走的长度T是一个经验值,当取T=1时,则边图LG中只有相邻节点对之间的相似度非零;当T增大时,节点之间的相似度发生相应的变化;不同的T值会产生不同的聚类树,利用最大化共表型相关系数来得到合适的T,的定义如下,其中,dij为D中i到j的距离,zij为聚类方法产生的i到j的cophenetic距离,分别为它们的平均值;步骤3),将边社区转化为节点社区;CL={P1,...,Pq}表示网络的边被划分成的q个边社区,定义网络中的节点u受到来自边社区PC的吸引度为:其中,(u,v)表示初始无向图G的一条边,u,v是该边的两个端点,su=∑vwuv为节点u的强度,表示边社区Pc内含有端点u的边的权值之和;吸引度表示边社区Pc内含有端点u的边的权值之和占节点u的强度的比例,若吸引度越大,则表示节点u被边社区Pc吸引的程度越强烈;根据定义可知当时代表u与Pc没有吸引,即u与Pc之间不存在连接;当时代表u完全被Pc吸引,即u在Pc内部;只要考虑处于边社区之间的边缘节点受到的吸引度,就能将边社区转化成节点社区,方法如下:步骤3‑1)找出边社区之间的边缘节点,边缘节点的表达式如下:edge‑node={u|(u,v)∈Pc,(u,w)∈Pd,l≤c<d≤q}其中,(u,v)和(u,w)分别代表属于不同边社区的边,u,v,w代表不同的节点;步骤3‑2)为了避免重叠节点数目过多,利用边缘节点受到的吸引度来调节重叠节点的数目;若边缘节点u受到的最大吸引度Imax来自于边社区Pm,1≤m≤q,它满足条件且Pm唯一,则将边缘节点u纳入边社区Pm,反之,边缘节点u仍为重叠节点;阈值δ的范围为[0,1],δ越小,条件越容易满足,重叠节点数目减少的越多;相反δ越大,条件越难满足,重叠节点数目减少的越少;通常取δ=1/2,即边缘节点受到的唯一最大吸引度大于0.5,则边缘节点可纳入对应的社区;若为无向无权图,则表示与边缘节点u相连的边有一半都在这个边社区里;大部分节点都被纳入边社区CL,小部分不能纳入的成为重叠节点,最终发现的社区是允许节点重叠的。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201510046401.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top