[发明专利]一种基于改进密度峰值的多粒度社区发现方法在审

专利信息
申请号: 201710963914.1 申请日: 2017-10-17
公开(公告)号: CN107909497A 公开(公告)日: 2018-04-13
发明(设计)人: 庞紫玲;王国胤;杨洁;李苑 申请(专利权)人: 重庆邮电大学
主分类号: G06Q50/00 分类号: G06Q50/00;G06K9/62
代理公司: 重庆市恒信知识产权代理有限公司50102 代理人: 刘小红
地址: 400065 重*** 国省代码: 重庆;85
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 改进 密度 峰值 粒度 社区 发现 方法
【权利要求书】:

1.一种基于改进密度峰值的多粒度社区发现方法,其特征在于,包括以下步骤:

1)、采用改进的密度峰值聚类算法与leading tree思想,形成包含所有节点的最粗粒度下的大型社区;改进的密度峰值聚类算法改进在:对密度峰值聚类的距离度量公式替换为能代表社交成员间关系的拓扑结构距离;,leading tree思想主要体现在:将社交的所有节点,通过Leading tree算法将真实社交网络中复杂的关系简化为联系强烈的从属拓扑结构;

2)、根据定义的粒化规则进行粒层的细化,采用分解机制将步骤1)最粗粒度下的大型社区分解为多个规模较小的社区;

3)、根据最终社区中心点集FCT进行社区网络粒层的划分,同时进行最优求解粒层的寻优,粒层划分终止即寻优结束后,得到最终的社区结构。

2.根据权利要求1所述的基于改进密度峰值的多粒度社区发现方法,其特征在于,所述改进后的密度峰值聚类算法进行社交网络节点的聚类处理,得到γ中心点决策图,聚类后形成的引导树代表全局社区拓扑结构图,因为每个成员链接到与其可达且社会重要度比其更大的成员,该全局社区拓扑图视为最粗粒度的问题求解空间。

3.根据权利要求1或2所述的基于改进密度峰值的多粒度社区发现方法,其特征在于,步骤1)改进的密度峰值算法具体为:

设数据点i,其密度值ρi由以下公式(1)计算:

其中dij是节点i与节点j的距离,采用欧式距离来计算二维数据点的距离,dc是截断距离;数据点i的与密度吸引点即密度比它大且相对距离比它更大的点距离计算为公式(2):Is表示数据集

其中,

将密度峰值算法中距离dij,采用社交网络中成员间的拓扑结构来替换,用节点间的拓扑距离来替代dij,社交网络的拓扑距离如下所示:

Γ(i)和Γ(j)分别代表社交网络节点i和节点j的邻接节点集,如果节点i和节点j之间不可达,则dij=∞;若节点i和节点j之间可达,但二者不存在其它公共节点,则dij=1;若节点i和节点j之间可达且存在多个公共节点,则dij<1。

4.根据权利要求2所述的基于改进密度峰值的多粒度社区发现方法,其特征在于,步骤2)根据定义的粒化规则进行粒层的细化,采用分解机制将步骤1)最粗粒度下的大型社区分解为多个规模较小的社区,具体包括如下步骤:

S21:采用冗余法从γ决策图中选择多个中心,构成潜在社区中心集合CT;

S22:计算CT中每个中心点引导的聚簇SC;

S23:对CT中的每个点,计算SC与从全局引导图T中截去SC剩余部分的相似度;

S24:根据具体网络的分布设定阈值thres,进行聚簇间相似程度的控制;

S25:从SC中选择相似度小于阈值thres且距离阈值thres最远的中心点作为一个社区中心,加入最终社区中心点集合FCT,同时将改点从CT中移除,令T=T-SC;

S26:重复步骤S25,直至到达终止条件:CT中没有潜在中心的相似度小于阈值,完成真实社区中心节点的寻找。

5.根据权利要求4所述的基于改进密度峰值的多粒度社区发现方法,其特征在于,所述步骤S23计算SC(i)与T-SC(i)的相似度公式为:

Similarity(SC,T-SC)=RI(SC,T-SC)*RC(SC,T-SC)α(5)

其中,RI(SC,T-SC)表示SC与T-SC的相对互连性,RC(SC,T-SC)表示SC与T-SC的相对近似度,α表示相对互连性与相对近似度之间的重要程度,取值范围为[0,1],α=1表示二者同等重要;

其中,EC(SC,T-SC)表示SC与T-SC的绝对互连性,SC与T-SC中相连边的总权重,EC(SC)和EC(T-SC)分别代表SC与T-SC内部的边权重和,表示连接SC与T-SC中相连边的平均权重,和分别表示SC与T-SC做最小截断时的平均权重,|SC|和|T-SC|分别表示SC与T-SC集合的元素个数。

6.根据权利要求5所述的基于改进密度峰值的多粒度社区发现方法,其特征在于,所述最终社区中心集FCT的计算过程:对于如果similarity(i)<thres,且maximum|similarity(i)-thres|同时满足,则将节点i加入FCT,同时将节点i从CT中移除,将SC(i)从T中移除;循环操作,直至不存在更多的i∈CT使similarity(i)<thres终止,得到最终社区中心集FCT后,根据中心点来对初始全局社区结构图进行划分,依次得到下一层细粒度上的多个小社区结构,可从多个划分粒层中选取适合问题求解的粒层,选择出最优的社区结构划分。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710963914.1/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top