[发明专利]社区结构的划分方法、装置、设备及计算机可读介质在审
申请号: | 201910295117.X | 申请日: | 2019-04-12 |
公开(公告)号: | CN111833199A | 公开(公告)日: | 2020-10-27 |
发明(设计)人: | 潘剑飞;戴明洋;杨胜文;石逸轩;周俊;许金泉 | 申请(专利权)人: | 北京百度网讯科技有限公司 |
主分类号: | G06Q50/00 | 分类号: | G06Q50/00 |
代理公司: | 北京市铸成律师事务所 11313 | 代理人: | 丁银泽;张臻贤 |
地址: | 100085 北京市*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 社区 结构 划分 方法 装置 设备 计算机 可读 介质 | ||
本发明提出一种社区结构的划分方法、装置、设备和计算机可读介质,所述方法包括:计算网络结构中的每个顶点的归属概率;根据获取的归属概率随机采样多个顶点,构成社区结构;计算社区结构模块度指标;判断所述社区结构的模块度指标是否达到预设条件;若否,则根据所述的模块度指标更新顶点的归属概率,并更新所述社区结构;若是,则输出当前的社区结构。本发明实施例通过顶点的归属概率确定社区结构,并通过迭代计算更新的方式,可以逐步优化全局的社区结构,使得社区结构中顶点的构成更加合理,更能体现全局的社区性。
技术领域
本发明涉及数据分析技术领域,尤其涉及一种社区结构的划分方法及装置、 设备和计算机可读介质。
背景技术
人与人之间的交互能构成相互之间的关系,相互的交互存在稀疏和紧密性。 根据人与人之间的交互的紧密性和稀疏性,可以将不同的人归属于不同的社区 结构中。所述社区结构是指社区结构内部之间人与人交互紧密,社区结构之外 人与人交互稀疏。其中,所述社区结构中的每个人都可以表示为该社区结构中 的顶点。
由于基于不同的交互关系,可能形成不同的社区结构。因此需要在在众多 相互交形成的社区结构中选取相对合理的社区结构。
发明内容
本发明实施例提供一种社区结构的划分方法、装置、设备及计算机可读介 质,以解决或缓解现有技术中的一个或多个技术问题。
第一方面,本发明实施例提供了一种社区结构的划分方法,包括:
计算网络结构中的每个顶点的归属概率;
根据获取的归属概率随机采样多个顶点,构成社区结构;
计算所述社区结构的模块度指标;
判断所述社区结构的模块度指标是否达到预设条件;若否,则根据所述的 模块度指标更新顶点的归属概率,并更新所述社区结构。
在一种实施方式中,该方法还包括:若判断所述社区结构的模块度指标达 到预设条件,则输出当前的社区结构。
在一种实施方式中,所述计算网络结构中的每个顶点的归属概率,包括:
获取顶点编码Unm和社区编码
计算顶点的社区归属概率Q,其中,所述softmax函数为归一化指数函数。
在一种实施方式中,所述根据获取的归属概率随机采样多个顶点,构成社 区结构,包括:
采用ε-greedy采样的策略将顶点分配到不同社区中,分配的概率表示为:其中,πi为表示第i顶点分配到第k个社 区的概率,ε表示采样概率,k表示社区数量,Qij表示第i个顶点对应第j个社 区的归属概率。
在一种实施方式中,所述社区结构的模块度指标表示为:
其中,M表示社区结构的模块度,ki表示顶点i的度,kj表示顶点i的度, Aij表示顶点间的邻接矩阵,e表示整个网络的边数,δ(ci,cj)表示顶点i与顶点 j是否归属于同一个社区结构,如果顶点i与顶点j属于同一个社区结构,则 δ(ci,cj)=1,如果顶点i与顶点j不属于同一个社区结构,则δ(ci,cj)=0。
在一种实施方式中,所述根据所述的模块度指标更新顶点的归属概率,并 更新所述社区结构,包括:
判断社区结构模块度Mcurr是否大于历史最大社区结构的模块度Mmax,若 是,则赋予顶点奖励向量;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京百度网讯科技有限公司,未经北京百度网讯科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910295117.X/2.html,转载请声明来源钻瓜专利网。