[发明专利]一种基于改进密度峰值的多粒度社区发现方法在审
申请号: | 201710963914.1 | 申请日: | 2017-10-17 |
公开(公告)号: | CN107909497A | 公开(公告)日: | 2018-04-13 |
发明(设计)人: | 庞紫玲;王国胤;杨洁;李苑 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06K9/62 |
代理公司: | 重庆市恒信知识产权代理有限公司50102 | 代理人: | 刘小红 |
地址: | 400065 重*** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 密度 峰值 粒度 社区 发现 方法 | ||
技术领域
本发明属于社交网络分析、粒计算以及聚类分析等领域,尤其涉及一种基于改进密度峰值算法融合多粒度思想的社区结构发现方法。
背景技术
社区结构是网络模块化与异质性的反映,表示真实网络可以看作是由许多不同类型节点组合形成的,如人际关系网络中的朋友圈子、引文网络中针对同一主题的相关论文、新陈代谢或蛋白质网络中的功能子团等等。深入研究网络的社区结构不仅有助于揭示错综复杂的真实网络是怎样由许多相对独立而又互相关联的社区形成的,使人们更好地理解系统不同层次的结构和功能特性,而且具有重要的实用价值。例如,社会网中的社区可用于揭示具有共同兴趣、爱好或社会背景的社会团体;蛋白质网络中的社区结构可用于发现生物系统中功能相关的结构单元;万维网中的社区结构可用于提高网络搜索的性能和准确性,实现信息过滤、热点话题跟踪和网络情报分析等。因此,社区发现是复杂网络领域中的一个非常重要的研究方向。
目前,社区发现研究的重点和焦点发生了一些变化,针对当前互联网技术推动下的在线社交网络等社会网络环境中的网络拓扑及社区结构的若干特点,社区发现的研究面临着若干挑战,如:要求探索同时属于多个社区的社区重叠性分析、大型网络局部社区的发现及分析、网络的多模式与多维性、网络节点角色含义的普适性研究、网络动态性分析研究。同时,当前存在的一些社区发现算法存在着这样一些问题,对大规模复杂网络难以处理,社区结构不稳定,要提前给定社区个数的方法存在很大误差,等等。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种得到较为稳定的社区结构、快速发现社交网络中潜在的社区结构的基于改进密度峰值的多粒度社区发现方法。本发明的技术方案如下:
一种基于改进密度峰值的多粒度社区发现方法,其包括以下步骤:
1)、采用改进的密度峰值聚类算法与改进的leading tree思想,形成包含所有节点的最粗粒度下的大型社区;改进的密度峰值聚类算法改进在:对密度峰值聚类的距离度量公式替换为能代表社交成员间关系的拓扑结构距离;,leading tree思想主要体现在:将社交的所有节点,通过Leading tree算法将真实社交网络中复杂的关系简化为联系强烈的从属拓扑结构。
2)、根据定义的粒化规则进行粒层的细化,采用分解机制将步骤1)最粗粒度下的大型社区分解为多个规模较小的社区;
3)、根据最终社区中心点集FCT进行社区网络粒层的划分,同时进行最优求解粒层的寻优,粒层划分终止即寻优结束后,得到最终的社区结构。
进一步的,所述改进后的密度峰值聚类算法进行社交网络节点的聚类处理,得到γ中心点决策图,聚类后形成的引导树代表全局社区拓扑结构图,因为每个成员链接到与其可达且社会重要度比其更大的成员,该全局社区拓扑图视为最粗粒度的问题求解空间。
进一步的,步骤1)改进的密度峰值算法具体为:
设数据点i,其密度值ρi由以下公式(1)计算:
其中dij是节点i与节点j的距离,采用欧式距离来计算二维数据点的距离,dc是截断距离;数据点i的与密度吸引点即密度比它大且相对距离比它更大的点距离计算为公式(2):Is表示数据集
其中,
将密度峰值算法中距离dij,采用社交网络中成员间的拓扑结构来替换,用节点间的拓扑距离来替代dij,社交网络的拓扑距离如下所示:
Γ(i)和Γ(j)分别代表社交网络节点i和节点j的邻接节点集,如果节点i和节点j之间不可达,则dij=∞;若节点i和节点j之间可达,但二者不存在其它公共节点,则dij=1;若节点i和节点j之间可达且存在多个公共节点,则dij<1。
进一步的,步骤2)根据定义的粒化规则进行粒层的细化,采用分解机制将步骤1)最粗粒度下的大型社区分解为多个规模较小的社区,具体包括如下步骤:
S21:采用冗余法从γ决策图中选择多个中心,构成潜在社区中心集合CT;
S22:计算CT中每个中心点引导的聚簇SC;
S23:对CT中的每个点,计算SC与从全局引导图T中截去SC剩余部分的相似度;
S24:根据具体网络的分布设定阈值thres,进行聚簇间相似程度的控制;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710963914.1/2.html,转载请声明来源钻瓜专利网。