[发明专利]一种基于网络拓扑结构和节点属性的社团检测方法有效
申请号: | 201410235386.4 | 申请日: | 2014-05-29 |
公开(公告)号: | CN104008165B | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 吕钊;吴钟刚 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海隆天律师事务所31282 | 代理人: | 臧云霄,潘一诺 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 拓扑 结构 节点 属性 社团 检测 方法 | ||
技术领域
本发明涉及PageRank技术、网络拓扑结构分析技术、主题模型技术、属性抽取技术、属性间相似性度量技术、社团检测及聚类算法技术领域,具体地说是一种基于复杂网络拓扑结构和网络节点属性信息的社团检测技术。
背景技术
近年来复杂网络越来越受到关注,比如社交网络,科学家合著网络,电子邮件网络等。在这些网络中,节点可以表示为一个人或者一篇文章等,网络中属性信息(比如社交网上用户的性别,爱好;论文合著网络上作者的研究领域),网络中节点之间的链接性以及节点具有的属性信息构成了属性图。基于属性图的社团检测的目标是划分这个属性图,使得同一个社团的节点比不同社团之间的节点连接更加紧密,而且同一个社团内部属性尽可能相似。
传统的社团检测方法大部分是基于图的拓扑结构(即节点之间的链接关系),基于属性相似。基于拓扑结构的方法主要可以分为三种类型:图划分、图密度、层级结构聚类。图划分通过往网络图中加边或删边的方式达到社团检测目的;图密度基于图的拓扑结构的链接密度进行社团检测;层次结构聚类基于节点间链接的强度将网络划分为若干社团。另外还有基于遗传优化的方法,利用生物学的进化思想适者生存,从目标函数中选择最优个体即为最终的社团划分。基于属性相似的方法一般做法是,通过某种判断方法将属性相似的划分到同一个社团,最终得到的社团能够满足同一个社团的属性信息是相似的。
以上单独基于网络拓扑结构的方法,未考虑属性对检测过程构成的影响,从而检测到的社团内部节点链接紧密度较高,但节点之间属性相似度不高;基于属性相似的方法,未考虑网络拓扑结构,从而检测到的社团往往具有属性相似,但是社团内部的链接紧密度不高。考虑到上述的不足,近年来学者把网络拓扑结构和属性信息结合起来考虑,主要有:基于距离的方法和基于模型的方法。基于距离的方法结合拓扑结构和节点的属性信息,利用随机游走算法计算网络中节点之间的距离(某一意义上说是节点之间的相似性),从而得到节点之间的距离,再通过一定的聚类方法对节点进行聚类。基于模型的方法主要是利用概率模型,节点的所属社团是一个概率分布,通过衡量节点之间连接的概率,再利用聚类算法,或者最大似然估计算法,进行社团检测。然而基于随机游走的距离算法涉及矩阵相乘,具有较高的时间复杂度;另外目前的大部分方法没有考虑到网络节点在网络拓扑结构上的全局重要性,没有将节点的全局重要性和局部拓扑结构(即节点的邻居这一特性)相结合。
发明内容
本发明的目的是针对现有技术的不足而提供的一种基于网络拓扑结构和节点属性信息相结合的、更加高效的社团检测方法,该方法针对有向图提出了节点在网络拓扑结构的重要性和节点的局部邻居结构相结合,得到节点之间的链接强度,再结合节点之间的属性相似度,最后通过聚类方法将节点聚集到相应的社团。
实现本发明目的的具体技术方案是:
一种基于网络拓扑结构和节点属性的社团检测方法,该方法包括以下步骤:
a)节点拓扑结构链接强度分析
计算网络中节点基于拓扑结构的重要性,利用节点的局部邻居,重新度量节点之间的链接强度;
b)节点属性抽取及相似性度量
抽取出属性,然后根据不同的属性类型,计算节点之间每个属性的相似度,最后计算节点之间所有属性的相似度;
c)拓扑结构与属性相结合
在求得节点之间的链接强度和节点属性相似度之后,利用权重调节因子结合二者,作为节点之间基于拓扑结构和属性的相似度。
d)节点聚类
首先初始化类别中心节点,然后根据每个节点与类别中心的相似度进行节点类别划分,再更新类别中心节点,最后计算目标函数值判断是否收敛。
所述步骤a)中计算网络中节点基于拓扑结构的重要性,具体包括:
首先构建节点的邻接矩阵A,读取整个网络结构后,构建邻接矩阵,若存在节点vi到vj的链接,则对应位置处设置为1,否则为0;
再采用PageRank算法计算节点基于拓扑结构的PageRank值,该值作为节点基于全局网络拓扑结构的重要性程度,算法运行后得到每个节点的重要性bi;
所述步骤a)中重新度量节点之间的链接强度,具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410235386.4/2.html,转载请声明来源钻瓜专利网。