[发明专利]社区发现方法、装置、计算机设备和存储介质有效
申请号: | 201910843820.X | 申请日: | 2019-09-06 |
公开(公告)号: | CN110738577B | 公开(公告)日: | 2022-02-22 |
发明(设计)人: | 邓强;张娟;屠宁;赵之砚;施奕明 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00;G06F16/953 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 姜晓云 |
地址: | 518033 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社区 发现 方法 装置 计算机 设备 存储 介质 | ||
本申请涉及大数据处理领域,具体是一种社区发现方法、装置、计算机设备和存储介质。所述方法包括:从关联数据库中提取关联数据,根据关联数据建立包括节点集群和向量的关系网络图,按照预先设置的更新规则对关系网络图中的每个节点的类别标签进行更新,并记录每个节点更新后的类别标签,得到更新后的节点集群;从更新后的节点集群中确定出类别标签发生变化的目标节点,并统计目标节点在所述更新后的节点集群中的比例值;判断比例值是否小于等于预设阀值;若比例值小于等于预设阀值,则将更新后的类别标签相同的节点聚类为一个社区,将聚类完成的社区发送给终端进行显示。采用本方法能够提高所发现的社区的稳定性,从而提高所发现社区的准确性。
技术领域
本申请涉及大数据处理技术领域,特别是涉及一种社区发现方法、装置、计算机设备和存储介质。
背景技术
在复杂的社会关系网络结构中,社区发现对社会关系特征分析具有重要意义。社区关系网络结构中的主体、主体与主体之间的关系构成图数据。图数据由节点和边组成,图中的节点表示发生连接的主体,边表示主体之间的关联。图数据内部连接比较紧密的节点子集合对应的子图叫做社区(community),对给定的图数据寻找其社区结构的过程称为“社区发现”。大体上看,社区发现的过程就是一种聚类的过程。
目前的社区发现普遍使用的方法是标准的类别标签传播算法,通过预设迭代次数作为类别标签传播算法的终止条件。类别标签传播方法为一种分布式的社团发现方法,其核心思想是预设迭代次数,在首次迭代时,为所有类别标签指定一个唯一类别标签;在每次迭代刷新时,对于某一个节点,考察其所有邻居节点的类别标签,并进行统计,将出现个数最多的那个类别标签赋给当前节点,当个数最多的类别标签不唯一时,随机选一个,直到达到预设迭代次数后,将相同类别标签的节点聚类为一个社区。
由于当出现最多类别标签不唯一时,采用的策略是随机选择,导致类别标签更新结果存在诸多不确定性,并且通过设置迭代次数控制算法终止,导致社区发现结果充满不稳定性。
发明内容
基于此,有必要针对上述技术问题,提供一种能够提高社区发现结果稳定性,提高社区归类的准确性的社区发现方法、装置、计算机设备和存储介质。
一种社区发现方法,包括
从关联数据库中提取关联数据,所述关联数据包括至少两个身份标识以及所述至少两个身份标识之间的关系记录;
根据所述关联数据建立包括节点集群和向量的关系网络图,所述节点集群中的每个节点用于表征所述身份标识,所述向量用于表征所述关系记录;
为所述关系网络图中的每个所述节点建立对应的类别标签;
按照预先设置的更新规则对所述关系网络图中的每个所述节点的类别标签进行更新,并记录每个所述节点更新后的类别标签,得到更新后的节点集群;
从所述更新后的节点集群中确定出类别标签发生变化的目标节点,并统计所述目标节点在所述更新后的节点集群中的比例值;
比例值判断所述比例值是否小于等于预设阀值;
若所述比例值小于等于所述预设阀值,则将更新后的类别标签相同的节点聚类为一个社区,将聚类完成的社区发送至终端进行显示。
在其中一个实施例中,所述方法还包括:
若所述比例值大于所述预设阀值,则对所述关系网络图中的每个所述节点的类别标签再次进行更新,直至更新后所述类别标签发生变化的节点的数量对应的比例值小于等于所述预设阀值;
将更新后的类别标签相同的节点聚类为一个社区,将聚类完成的社区发送至终端进行显示。
在其中一个实施例中,所述根据所述关联数据建立包括节点集群和向量的关系网络图,包括:
将存在所述关系记录的所述身份标识映射为关系网络图中的节点;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910843820.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:为受损车辆生成定损文件的方法及装置
- 下一篇:一种植物群落最小面积分析方法