[发明专利]一种基于密度峰的动态图聚类方法在审

专利信息
申请号: 201910080266.4 申请日: 2019-01-28
公开(公告)号: CN109886313A 公开(公告)日: 2019-06-14
发明(设计)人: 谷峪;吴长发;于戈 申请(专利权)人: 东北大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 沈阳东大知识产权代理有限公司 21109 代理人: 李在川
地址: 110819 辽宁*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 聚类 动态图 聚类结果 依赖图 演化事件 异常顶点 决策图 索引 删除 初始化阶段 动态变化 动态更新 动态检测 算法效率 初始化 结果集 静态图 相似度 峰顶 噪声 返回 更新 创建 发现
【说明书】:

发明提供了一种基于密度峰的动态图聚类方法,用于对动态图进行聚类,实时返回聚类结果以及发现簇演化事件,其中聚类结果包括图中的簇、异常顶点以及桥顶点。包括静态图聚类方法和动态图聚类方法两部分,分为初始化和动态检测两个阶段。在初始化阶段,计算顶点的局部密度、依赖顶点和依赖相似度;为提升算法效率,生成DP‑Index索引;生成决策图,通过决策图得到密度峰顶点和噪声顶点;基于密度峰思想获得簇结果集、异常顶点集以及桥顶点集;根据聚类结果创建依赖图,为动态图聚类打下基础。在动态更新阶段,根据顶点的插入或删除和边的插入或删除更新DP‑Index索引以及依赖图;根据依赖图以及依赖图的动态变化获得聚类结果以及簇演化事件。

技术领域

本发明属于计算机大规模图数据处理领域,具体涉及一种基于密度峰的动态图聚类方法。

背景技术

由于图模型具有强大的表现力,许多现实世界的应用将数据和数据之间的关系建模为图,其中顶点代表相应的实体,边代表实体之间的关系。随着社交网络,信息网络,引文网络,协作网络,电子商务网络,通信网络和生物网络等网络应用的大量涌现,如何有效地管理和分析图数据已经获得越来越多人们的关注。其中,图聚类作为一个基本问题,已经被广泛研究。

图聚类是针对图数据的聚类。图聚类的目的就是根据顶点间的相似度将网络中的顶点划分为几个密集连接的子图,又被称为簇,使得同一个簇内的顶点连接相对稠密,不同簇之间的连接相对稀疏。实际网络中的簇代表着特定对象的集合,如,社会网络中的簇代表根据兴趣或背景而形成的真实的社会团体;引文网络中的簇代表针对同一主题的相关论文。发现这些网络中的簇有助于我们更加有效地理解和开发这些网络,例如可以捕捉引文网络中联系强烈的在线文档,发现社交网络中共享社交环境的社交群体,以及分析人们在网购时经常一起购买的产品等等。

现在已经提出了很多类型的图聚类方法,但是仍存在以下两方面挑战:

第一,识别桥和异常顶点

虽然检测簇很重要,但是检测图中的桥和异常顶点也很重要。在一个图中,每一个顶点都扮演着不同的角色。例如有些人可能与很多团体都很友好却不属于其中任何一个团体(例如政客们),称为桥。而有些人只与较少的人来往(例如隐士),称为异常顶点。识别桥和异常顶点对于挖掘不同的复杂网络来说十分重要。此外,目前许多图聚类算法还存在需输入参数、调整参数、时间复杂度过高等问题。

第二,实时处理动态图以及追踪簇演化事件

大量的算法根据各自的不同的簇定义提出了能够自动聚类的方法。但是目前大多数方法都是从一个非常严格的假设开始的,也就是现实世界可以用静态网络进行建模。然而,很多真实世界的网络是不断更新的,随着时间的推移,顶点和边都可以加入并离开网络,从而在图拓扑上产生相关的变化,聚类结果也会随之发生变化。现有的图聚类算法应该考虑适配动态图。但是目前的图聚类方法大多针对静态网络,在处理动态网络时显得力不从心。此外传统的图聚类算法旨在识别隐藏的簇结构,而动态图聚类方法则应致力于跟踪动态图的局部拓扑及其突变,但目前很少有方法能做到这一点。这些局部拓扑变化及突变又被称为簇演化事件。追踪簇演化事件具有重要的现实意义。例如在美国大选期间,在Facebook等社交网络后台进行动态图聚类,参选人员可以及时的得知支持各个参选人员的簇的数量、大小、以及细致的人员流向动态等,然后可以根据实时的簇的动态变化及时的采取相应的措施来保证自己的政治支持度。

总的来说,目前的图聚类算法无法很好地解决以上两方面问题,这就迫切的需要用新的方法与技术来迎接动态图聚类问题的挑战。

发明内容

为了克服现有技术的不足,本发明提供了一种基于密度峰的动态图聚类算法。

本发明的方法包括如下步骤:

步骤1:对图中的每对邻接顶点计算结构相似度,所采用的结构相似度公式为:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东北大学,未经东北大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910080266.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top