[发明专利]一种基于网络拓扑结构和节点属性的社团检测方法有效
申请号: | 201410235386.4 | 申请日: | 2014-05-29 |
公开(公告)号: | CN104008165B | 公开(公告)日: | 2017-05-24 |
发明(设计)人: | 吕钊;吴钟刚 | 申请(专利权)人: | 华东师范大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 上海隆天律师事务所31282 | 代理人: | 臧云霄,潘一诺 |
地址: | 200241 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 网络 拓扑 结构 节点 属性 社团 检测 方法 | ||
1.一种基于网络拓扑结构和节点属性的社团检测方法,其特征在于,所述的方法包括以下步骤:
a)节点拓扑结构链接强度分析
计算网络中节点基于拓扑结构的重要性,利用节点的局部邻居,重新度量节点之间的链接强度,包括:
首先构建节点的邻接矩阵A,读取整个网络结构后,构建邻接矩阵,若存在节点vi到vj的链接,则对应位置处设置为1,否则为0;
再采用PageRank算法计算节点基于拓扑结构的PageRank值,该值作为节点基于全局网络拓扑结构的重要性程度,算法运行后得到每个节点的重要性bi;
所述步骤a)中重新度量节点之间的链接强度,还包括:
节点vi和vj之间的链接强度为节点vi到vj的链接强度与节点vj到vi的链接强度之和;而节点vi到vj的链接强度为vj的全局重要性bj除以节点vi的所有链出邻居节点的全局重要性之和;同理计算出vj到vi的链接强度;节点vi到vj的链接强度TS(i,j)计算公式如下:
其中,NO(i)表示节点vi的链出邻居集,根据上述计算公式,得到节点vi和vj之间的链接强度TsS(i,j),计算如下:
TsS(i,j)=TS(i,j)+TS(j,i);
b)节点属性抽取及相似性度量
抽取出属性,然后根据不同的属性类型,计算节点之间每个属性的相似度,最后计算节点之间所有属性的相似度;
c)拓扑结构与属性相结合
在求得节点之间的链接强度和节点属性的相似度之后,利用权重调节因子结合二者,作为节点之间基于拓扑结构和属性的相似度;
d)节点聚类
首先初始化类别中心节点,然后根据每个节点与类别中心的相似度进行节点类别划分,再更新类别中心节点,最后计算目标函数值判断是否收敛。
2.根据权利要求1所述的方法,其特征在于所述步骤b)中抽取出属性,具体包括:
若节点的描述信息为文本内容,则用潜在狄利克雷LDA主题模型抽取该文本信息的主题分布,然后将该主题分布作为该节点的属性;若节点的描述为离散的或者连续的,则直接将它们作为节点的属性。
3.根据权利要求1所述的方法,其特征在于所述步骤b)中计算节点之间每个属性的相似度,具体包括:
对于离散型属性,直接比较属性的相同与否;对于连续型属性,利用欧几里得公式计算属性的相似度;对于文本型属性,在得到该文本主题分布后,利用余弦相似度方法度量属性相似度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华东师范大学,未经华东师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410235386.4/1.html,转载请声明来源钻瓜专利网。