[发明专利]一种基于局部相似度的社区挖掘方法有效
申请号: | 201410167205.9 | 申请日: | 2014-04-24 |
公开(公告)号: | CN103927371B | 公开(公告)日: | 2017-02-22 |
发明(设计)人: | 翁伟;朱顺痣;曾志强;张念;肖蕾;马樱 | 申请(专利权)人: | 厦门理工学院 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京科亿知识产权代理事务所(普通合伙)11350 | 代理人: | 汤东凤 |
地址: | 361024 福建省厦门市集美区*** | 国省代码: | 福建;35 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 局部 相似 社区 挖掘 方法 | ||
1.一种基于局部相似度的社区挖掘方法,其特征在于,包括以下步骤:
(1)根据网络的邻接矩阵计算各结点对的相似度;
(2)如果某结点对的相似度是其邻接结点中相似度最大的,这找出这些结点对构成紧密点对;
(3)若某些结点构成的集合,其中的某个结点总有另外一个在集合中的结点与之构成紧密点对,并且任何一个在里面的结点,与之构成紧密点对的另外一个结点均不在集合之外,这些结点就构成了紧密微社团;找出所有这些紧密微社团;
(4)给所有的紧密微社团赋予初始标签,同一个紧密微社团中的结点初始标签相同,紧密微社团之间的初始标签不同;
(5)根据投票原则进行标签传播,直到任何结点的标签均不能更新;
(6)得到了最终的社团结构。
2.根据权利要求1所述的基于局部相似度的社区挖掘方法,其特征在于:
(1)相似度的计算方法
设网络G=(V,E),其中V={v1,v2,......vn}为结点集合,E={e1,e2,......em}为边集,其中ei∈V×V;vi的邻居记为N(vi),即N(vi)={vj|wij>0},vi的星型邻域St(vi)={vi}∪N(vi);记表示结点vi关联的边权值之和,定义为vi的度;
那么结点对(vi,vj)的相似度计算公式如下:
根据上式,结点vi和vj的相似度与他们星型邻域交集中结点的度有关,度越大说明该点对vi和vj的相似度贡献越小,这是因为这种情况下中介点的连接作用被分散了;分母起到归一化使得Sij∈[0,1],Sij=0时说明结点vi和vj既不相连接也没有共同的邻居,Sij=1时要么是i=j,要么是结点vi和vj只和对方互相连接而无其他邻接点;由此看来,若结点vi和vj有共同的邻居,则这两个结点的相似度总大于零,避免的其他度量方法的低估现象;只计算存在边的结点之间的相似度;
(2)紧密点对的计算方法;
如果某结点对(u,v)的相似度是其邻接结点中相似度最大的,称之为紧密点对,即σ(u,v)=max{s(x,y)|(x=u,y∈Γ(u)-{u})∨(x=v,y∈Γ(v)-{v})},记作
其中ε=σ(u,v);找出这些结点对构成紧密点对的集合;
(3)紧密微社团的计算方法;
若某些结点构成的集合,其中的某个结点总有另外一个在集合中的结点与之构成紧密点对,并且任何一个在里面的结点,与之构成紧密点对的另外一个结点均不在集合之外,这些结点就构成了紧密微社团;紧密微社团事实上是一个子图,可记为C(a)=(V',E',ε),满足三个条件:1)a∈V';2)对任何u∈V',存在
(4)初始标签的赋值方法;
给所有的紧密微社团赋予初始标签,同一个紧密微社团中的结点初始标签相同,紧密微社团之间的初始标签不同;
(5)标签传播的方法
(5.1)将网络中的结点按度从大到小的次序放入集合X中,然后
(5.2)设置t=1;
(5.3)按X中的次序取出每个结点x∈X,将x的邻接结点按标签类型分组,数量最多的那一组的标签赋予x,若存在数量最多的分组有多个,那么选择分组中各结点度之和最大的那个分组的标签;
(5.4)如果前后两次标签赋值未发生变化,那么算法结束;否则设t=t+1,转(5.3)。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于厦门理工学院,未经厦门理工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410167205.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种聚丙烯抗老化涂料
- 下一篇:一种可降解材料