[发明专利]一种基于紧密度排序的网络社区发现方法在审
申请号: | 201510926334.6 | 申请日: | 2015-12-14 |
公开(公告)号: | CN105574541A | 公开(公告)日: | 2016-05-11 |
发明(设计)人: | 雷涛;吕慧;高红霄 | 申请(专利权)人: | 天云融创数据科技(北京)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100176 北京市大兴区亦庄经*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 密度 排序 网络 社区 发现 方法 | ||
技术领域
本发明涉及复杂网络社区发现领域,特别是涉及一种基于紧密度排序的网 络社区发现方法。
背景技术
现实世界中的很多复杂系统都可以抽象为一个复杂网络,如人际关系网、 万维网、投资网络和金融网络等。复杂网络由于其自身具有规模庞大、节点及 连接复杂等特点,直接对复杂网络整体进行研究往往具有一定难度,但是复杂 网络中普遍存在着社区结构,即社区内部的节点具有更加密切的联系。社区发 现有利于探究网络的结构与功能,发现其中隐藏的规律及预测其行为,比如, 可以对投资担保网络进行风险识别、对金融供应链中的经济资产进行评估量化、 对区块链进行实时定价结算等。社区作为复杂网络中的一个重要属性,对复杂 网络中社区的研究已经引起了越来越多的关注和重视。
在复杂网络中,处于相同社团内的节点联系紧密,不同社团间的节点联系 稀疏。根据这一特点发现,复杂网络的社团结构发现与数据的聚类分析很相似, 在定义了网络节点的相似度以后,就可以比较容易地将网络社区划分问题转化 为聚类问题。很多已有的社区发现算法都采用数据挖掘中的相关聚类算法,对 网络中的节点以定义的相似度进行聚类挖掘,使其中关系紧密的节点能够聚集 在一起,从而实现社区划分。例如典型的K-means方法,K-median方法等聚类 算法,其思想被广泛的应用于社区发现算法之中,并取得了不错的划分效果。 但是该类算法需要提供社区划分个数、社区规模大小等一些先验信息,而这些 先验信息一般情况下是事先难以得到的。
发明内容
聚类问题和网络社区划分问题虽然存在内在的一致性,但是在本质上二者 并不完全等同。聚类分析问题中的每一个数据点是孤立存在的,而网络中的每 一个节点具备聚类分析问题所不具备的网络拓扑结构性质,针对这一问题,本 发明采用了基于网络拓扑结构性质的相似度构造方法;同时为了避免对先验信 息的设定,本发明还通过计算中心节点的选择阈值和合并小社区,自适应的确 定网络的隐含结构。
上述发明目的是通过以下技术方案实现的:
步骤1:计算网络初始中心节点集。计算网络各节点的紧密度中心性值,根 据紧密度中心性值进行排序,并根据网络结构设置阈值,以此选择初始中心节 点集。
步骤2:计算网络节点的相似度。考虑到网络中的每个节点不仅受其邻居节 点的影响,还受到其它节点经过拓扑性质传递给它的影响,采用信号传递的思 想将网络拓扑结构信息转化为空间向量信息,再对其进行标准化之后运用余弦 距离计算相应的相似度矩阵。
步骤3:划分社区。利用节点之间的相似度将网络中的节点划分到最近的社 区中,即将每一个节点归类到与之最相似的中心节点所属社区中。
步骤4:小社区合并。当所有节点划分完成后,若社区中的节点个数少于3 个,则将该社区的中心节点从中心节点集中删除,且其所有节点重新进行社区 划分。
步骤5:更新中心节点集。将每一个社区当作一个小的网络再次进行紧密度 中心性计算,利用节点的紧密度排序找到每一个小网络的中心节点,然后更新 所有的中心节点。若所有新中心节点均与原中心节点相同,则停止迭代;否则, 返回步骤3重新进行社区划分,直至中心节点集不再变化。
所述步骤1的具体步骤为:
1)计算网络各节点的紧密度中心性,首先计算一个节点到网络中的其它所 有节点的平均距离:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天云融创数据科技(北京)有限公司,未经天云融创数据科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510926334.6/2.html,转载请声明来源钻瓜专利网。