[发明专利]基于节点重要度的标签传播社区发现算法在审
申请号: | 201710238093.5 | 申请日: | 2017-04-13 |
公开(公告)号: | CN107194818A | 公开(公告)日: | 2017-09-22 |
发明(设计)人: | 张贤坤;任静;荚佳;宋琛;张倩 | 申请(专利权)人: | 天津科技大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 天津盛理知识产权代理有限公司12209 | 代理人: | 王利文 |
地址: | 300222 天津市河*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 节点 重要 标签 传播 社区 发现 算法 | ||
技术领域
本发明属于智能信息处理技术领域,尤其是一种基于节点重要度的标签传播社区发现算法。
背景技术
社会网络中的社区发现对于社会网络分析具有重要意义。近10年来,已有很多社会网络社区发现方法被提出,依据采用的求解策略不同,主要可以分为基于优化的社区发现方法和基于启发式的社区发现方法,基于优化的方法通过设置目标函数并迭代逼近函数最优值实现社区发现,具有代表性的方法包括谱方法和模块度最大化方法。基于启发式策略的方法通过设置启发规则来寻找最优社区划分,代表性的算法如GN(Girvan-Newman)算法和WH(Wu-Huberman)算法。
标签传播算法是一种基于图的半监督学习方法,其基本思路是用已标记节点的标签信息去预测未标记节点的标签信息。其利用样本间的关系建立关系完全图模型,在完全图中,节点包括已标注和未标注数据,其边表示两个节点的相似度,节点的标签按相似度传递给其他节点。标签数据就像是一个源头,可以对无标签数据进行标注,节点的相似度越大,标签越容易传播。
2007年,Raghavan等人提出了一种基于标签传播思想的快速社区发现算法LPA(Label Propagation Algorithm),LPA算法在迭代更新节点标签的过程中存在不确定性和随机性,导致其结果准确性和稳定性常常不能达到预期。之后又有学者分别从不同角度对LPA算法进行改进,但是这些算法仅根据标签的个数评判标签的影响力,没有考虑标签更新的顺序和节点自身重要度对标签选择的影响。在大规模社交网络中,比如微博社会网络,如果考虑节点先验属性对节点重要度的影响。
综上所述,现有的标签传播算法在准确性和稳定性上都存在很大的提升空间。
发明内容
本发明的目的在于克服现有技术的不足,提供基于节点重要度的标签传播社区发现算法,能够在复杂度相似的情况下能够显著提高社区发现的质量,缩短迭代周期,从而提高社区发现的准确性和稳定性。
本发明解决其技术问题是采取以下技术方案实现的:
一种基于节点重要度的标签传播社区发现算法,包括以下步骤:
步骤1:初始化每个节点的唯一标签;
步骤2:计算每个节点重要度,并按节点重要度从高到低对节点排序,生成有序序列;
步骤3:设置迭代次数t=1;
步骤4:对有序序列中的任意节点,根据标签选择方法和标签更新规则将该节点的标签更新为其邻接节点标签集中影响力最大的标签;
步骤5:设置最大迭代次数为max Iter,若迭代次数t==max Iter或每个节点的标签为影响力最大的标签,则将具有同样标签的节点归入相同社区,处理结束;否则,迭代次数t加1,返回步骤4;
进一步,所述步骤2节点重要度的计算公式为:
其中,NI(i)表示节点i的重要度,Inf(i)表示节点i的先验重要度,α表示衡量邻接节点重要度对节点i影响力的系数,α取值从0到1,N(i)表示节点i的邻接节点集,d(j)表示节点i的邻接节点j的度数。
进一步,所述步骤4标签选择方法的计算公式如下:
其中,LI(i,l)表示标签l对节点i的影响力,Nl(i)表示节点i周围标签为l的集合,d(j)表示节点i的邻接节点j的度数,NI(j)表示节点i的相邻节点j的重要度。
进一步,所述步骤4标签更新规则的计算公式如下:
其中,ci表示节点i的邻接标签出现多个标签的数量同为最大值时选择的标签,l max表示标签数量为最大值的标签集合,LI(i,l)表示标签l对节点i的影响力。
本发明的优点和积极效果是:
本发明通过计算每个节点重要度并按节点重要度从高到低对节点排序,同时采用标签选择方法和标签更新规则进行节点标签更新,能够在复杂度相似的情况下能够显著提高社区发现的质量,缩短迭代周期,能够准确并稳定地发现网络中的社区,可广泛用于社区发现、社交网络等领域。
附图说明
图1a为本发明更新节点4的示意图;
图1b为本发明更新节点6的示意图;
图1c为本发明更新节点2的示意图;
图2为本发明与NIBLPA、LPA在不同参数α得到的模块度对比图;
图3为本发明与NIBLPA、LPA在参数α=0.4时的50次重复试验对比图;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津科技大学,未经天津科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710238093.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:主阀衬套的制造工艺方法
- 下一篇:一种滚针机自动组装机