[发明专利]一种社群划分方法、装置、存储介质及电子装置在审

专利信息
申请号: 201911419710.7 申请日: 2019-12-31
公开(公告)号: CN111159577A 公开(公告)日: 2020-05-15
发明(设计)人: 姜旭;李嘉琛 申请(专利权)人: 北京明略软件系统有限公司
主分类号: G06F16/9536 分类号: G06F16/9536;G06Q50/00
代理公司: 北京康信知识产权代理有限责任公司 11240 代理人: 张秀英
地址: 100086 北京市海淀区中关村东路*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 社群 划分 方法 装置 存储 介质 电子
【说明书】:

发明提供了一种社群划分方法、装置、存储介质及电子装置,该方法包括:将关系数据处理为图结构数据;统计该图结构数据的联通性,将该图结构数据划分为第一社群集合;在该第一数量小于预先设置的社群数量的情况下,通过标签传播算法LPA将该图结构数据划分为第二社群集合;对该第二社群集合中的社群进行中心度计算,确定该第二社群集合中社群的中心点;和/或,在该第一数量大于或等于该预先设置的社群数量的情况下,对该第一社群集合中的社群进行中心度计算,确定该第一社群集合中社群的中心点,可以解决相关技术中通过GN算法划分社群存在时间复杂度太高,且不知道最后会有多少社群的问题,提高了社群划分的准确性。

技术领域

本发明涉及信息技术领域,具体而言,涉及一种社群划分方法、装置、存储介质及电子装置。

背景技术

社群是由无数群成员构成的,而社群的KOL就是这些社群成员的连接点,KOL的意思是舆论领袖,这个群体往往拥有非常广阔的人脉,大家对他们通常会比较服气。社群管理者可以通过找出这些KOL,让他们定时通过文字或是直播的方式分享一些经验和内容,这样的话在提升了社群活跃度的同时,还能够让社群的价值进一步提升。

社区发现用来发现网络中的社区结构,也可以看作是一种聚类算法。

现有的划分方法,过于依赖人的主观判断,不能及时动态的反映社群的发展情况和动态结构。

在现有的实际运作过程中,主要通过以下两种方法划分社群:

1、图分割法

图分割方法大多是基于迭代二分法的,基本思想是将图分割成两个子图,然后迭代,最后得出要求的子图数。经典的算法有Kernighan-Lin算法和谱二分算法。

K-L(Kernighan-Lin)算法是一种将已知网络划分为已知大小的两个社区的二分方法,它是一种贪婪算法。它的主要思想是为网络划分定义了一个函数增益Q,Q表示的是社区内部的边数与社区之间的边数之差,根据这个方法找出使增益函数Q的值成为最大值的划分社区的方法。具体策略是,将社区结构中的结点移动到其他的社区结构中或者交换不同社区结构中的结点。从初始解开始搜索,直到从当前的解出发找不到更优的候选解,然后停止。

谱二分算法,当网络中存在两个社区结构时,就能够根据非零特征值所对应的特征向量中的元素值进行结点划分。把所有正元素对应的那些结点划分为同一个社区结构,而所有负元素对应的结点划分为另外一个社区结构。谱二分算法利用的是Laplace矩阵的特征值和特征向量的性质来做社区划分。Laplace矩阵的第二小特征值λ2的值越小,划分的效果就越好。所以谱二分法使用Laplace矩阵的第二小特征值来划分社区。

上述的图分割法存在以下缺点:K-L算法的缺陷是必须先指定了两个子图的大小,不然不会得到正确的结果,实际应用意义不大;谱平分法一次只能划分2个社区,如果需要划分多个,需要执行多次;如果只需要划分两个社区,谱平分法的效率比较高,但是要划分多个社区的时候,效率就不高了。

2、GN算法

在一个网络之中,通过社区内部的边的最短路径相对较少,而通过社区之间的边的最短路径的数目则相对较多。下图中展示了变得强度以及边介数在现实网络中的分布情况。GN算法是一个基于删除边的算法,本质是基于聚类中的分裂思想,在原理上是使用边介数作为相似度的度量方法。在GN算法中,每次都会选择边介数高的边删除,进而网络分裂速度远快于随机删除边时的网络分裂。

GN算法的步骤如下:计算每一条边的边介数;删除边界数最大的边;重新计算网络中剩下的边的边阶数;重复上述步骤,直到网络中的任一顶点作为一个社区为止。

GN算法存在以下缺点:不知道最后会有多少个社区;在计算边介数的时候可能会有很对重复计算最短路径的情况,时间复杂度太高;GN算法不能判断算法终止位置。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京明略软件系统有限公司,未经北京明略软件系统有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201911419710.7/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top