[发明专利]一种自动确定社区数目的快速符号社区发现系统及算法在审
申请号: | 201810022277.2 | 申请日: | 2018-01-10 |
公开(公告)号: | CN108268625A | 公开(公告)日: | 2018-07-10 |
发明(设计)人: | 赵学华;谭旭;唐飞;徐龙琴 | 申请(专利权)人: | 深圳信息职业技术学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06Q50/00 |
代理公司: | 北京汇信合知识产权代理有限公司 11335 | 代理人: | 王秀丽 |
地址: | 518000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 链接 向量 概率 社区发现 网络模型 自动确定 社区 矩阵 时间复杂度 并行计算 参数估计 邻接矩阵 模型选择 社区挖掘 指示节点 网络 节点数 模型块 算法 | ||
1.一种自动确定社区数目的快速符号社区发现系统,其特征在于:包括网络N的邻接矩阵A和网络模型(NModel);
所述的网络模型(NModel)=(n,K,Z,π,θ,ω),其中,n对应于网络的节点数;K是模型块数,对应于网络中的社区数;Z为n×K维矩阵,其元素Zi是K维的指示向量;π={π1,π-1,π0}是3维向量,其中,π1表示块内正链接的连接概率,π-1表示块内负链接的连接概率,π0表示块内无链接的概率;θ={θ1,θ-1,θ0}是3维向量,其中,θ1表示块间正链接的连接概率,θ-1表示块间负链接的连接概率,θ0表示块间无链接的概率;ω是K维向量,指示节点分布在不同块内的比例关系,且满足
2.一种基于权利要求1自动确定社区数目的快速符号社区发现系统的算法,其特征在于:首先初始化模型参数(n,K,τ,μ0,η0,ε),然后将其与网络拟合,通过变分近似和点估计推导模型的变量Zi和参数π,θ,ω的表达式,由模型的变量Zi和参数π,θ,ω的表达式得到学习模型参数(K,τ,μ,η),同时进行模型选择,确定K值,直至收敛,学习出最优模型,基于学习出的最优模型,基于参数τ确定符号网络的社区划分。
3.根据权利要求2所述的一种自动确定社区数目的快速符号社区发现系统的算法,其特征在于:所述的变分近似包括π的先验分布为参数为{η10,η-10,η00}的狄雷克利分布,θ的先验分布为参数为{μ10,μ-10,μ00}的狄雷克利分布;所述的点估计包括ω的先验分布服从ρ0={ρ10,…,ρK0}的狄雷克利分布。
4.根据权利要求3所述的一种自动确定社区数目的快速符号社区发现系统的算法,其特征在于:所述模型的变量Zi的近似分布服从参数为τi={τi1,...,τiK}的多项式分布,满足公式:
其中,aij为网络N的邻接矩阵A的元素,Ψ(·)为Digamma函数。
5.根据权利要求4所述的一种自动确定社区数目的快速符号社区发现系统的算法,其特征在于:
所述参数π的表达式:π的近似分布服从参数为η的狄雷克利分布,满足公式:
所述θ的表达式:θ的近似分布服从参数为η的狄雷克利分布,满足公式:
所述ω的表达式:
6.根据权利要求2-5中任意一项自动确定社区数目的快速符号社区发现系统的算法,其特征在于:
具体步骤如下:
步骤1):输入网络N的邻接矩阵A;
步骤2):初始化参数(n,K,τ,μ0,η0,ε),其中,所述的ε为判断条件阈值;
步骤3):根据公式
计算τ,并进行标准化:
步骤4):根据公式
计算μ,η;
步骤5):根据公式
计算ω。
步骤6):更新ω、τ、K:查找ω中等于0的元素及标号L,并删除值为0的分量,得到新的ω;删除τ中对应标号L的列向量,得到新的τ;更新K值为ω包含的元素数目;
步骤7):计算||τ-τold||2,其中,||·||2为二阶范数,τold为上次计算的值;
步骤8):如果||τ-τold||2<ε,则转至步骤9),否则转至步聚3);
步骤9):输出社区划分结果:节点i的社区所属根据以下公式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳信息职业技术学院,未经深圳信息职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810022277.2/1.html,转载请声明来源钻瓜专利网。