[发明专利]一种局部社团挖掘方法在审
申请号: | 201610068175.5 | 申请日: | 2016-02-01 |
公开(公告)号: | CN105740907A | 公开(公告)日: | 2016-07-06 |
发明(设计)人: | 封筠;张晓芬;董大为;綦朝晖 | 申请(专利权)人: | 石家庄铁道大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/00 |
代理公司: | 石家庄国为知识产权事务所 13120 | 代理人: | 王占华 |
地址: | 050043 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 局部 社团 挖掘 方法 | ||
技术领域
本发明涉及复杂网络技术领域,尤其涉及一种局部社团挖掘方法。
背景技术
现实世界中存在各种各样的复杂网络,由于网络内各节点间的相互作用及动态演化,在网络内部就会形成一些节点之间连接紧密,而与其它节点连接比较稀疏的节点集合,这些集合就称为社团结构。社团结构是复杂网络的一个重要拓扑特征。社团结构挖掘对分析网络结构和理解网络性质具有重要意义,在社会、经济、物理、生物、交通和计算机等学科和领域中具有高度实用性。
在网络中并不是所有节点的作用都一样,有些节点比较重要,称之为核心节点。节点重要性评估对理解和分析复杂网络社团结构有重要作用。网络中的重要节点往往是所属社团中心,社会关系比如小到学校、专业、班级,大到城市、国家、民族都可以从社团结构角度去理解。通过探究重要节点间的关系来研究网络社团结构,对社团挖掘研究有重要的推动作用。
目前所提出的节点重要性评估方法主要归纳为如下三大类:
(A)社会网络分析方法:
由于每个节点都有特殊之处,每个节点的重要性差异是通过对网络的一些基本指标统计分析,探测节点所处环境的特征,然后放大这些节点的显著性,从而量化节点的重要性。度量方法主要包括度中心性法、介数法、紧密度法、特征向量法、互信息法和累计提名等。这类方法是在保证网络整体性的前提下,基于网络的某一特性提出,从不同的角度探讨节点重要性的。
(B)系统科学分析方法:
将节点的重要性等价为该节点被删除后对系统的破坏性。对网络破坏程度越大的节点重要性越高,其主要研究成果就是系统的“核与核度”理论,其研究思路源于图论中点割集的概念。对网络连通的破坏程度越大,被删除的节点(集)越重要,因为网络连通的维持依赖于它们的存在。
(C)信息搜索领域分析方法:
近年来随着互联网的迅猛发展,网页的重要性排序成为信息科学搜索领域的重要功能之一,也可以从复杂网络节点重要性角度去描述,将网页抽象成网络节点,超链接抽象为网络中的边,搜索引擎呈现的就是网页按照重要性排序后的检索结果。目前,网页重要性评估最著名的的方法有PageRank方法和HITS方法。PageRank方法是利用网络自身的超链接结构确定所有网页的重要性等级数。HITS方法中的网页重要性是通过每个网页的内容权威和链接枢纽属性值来计算的。
目前,复杂网络社团结构挖掘大多基于聚类方法,具体来说主要有以下几种:
(1)谱方法:具有严密的数学理论,最早用于解决图分割问题,目前已发展成为一种重要的数据聚类方法(称为谱聚类法)。该方法采用二次型优化技术最小化预定义的“截”函数。具有最小“截”的划分被认为是最优的网络划分。谱方法本质上是一种二分法,在每次二分过程中,网络被分割成两个近似平衡的子网络。
(2)局部搜索聚类方法:主要有Kernighan-Lin(简称KL)方法、快速Newman(简称FN)方法和Guimera-Amaral(简称GA)方法。
(a)KL方法的优化目标是极小化簇间连接数目与簇内连接数目之差;其候选解搜索策略是将节点移动到其他簇或交换不同簇的节点。在整个搜索过程中,KL方法只接受更好的候选解,而拒绝所有较差的候选解,因此它找到的解往往是局部最优而不是全局最优解。
(b)FN方法是Newman于2004年提出的一种基于局部搜索的快速复杂网络聚类方法,其优化目标是极大化Newman和Girvan在同年提出的网络模块度评价函数。一般地,好的网络簇结构对应较大的模块度评价函数值。该方法候选解的局部搜索策略是选择且合并两个现有的网络簇。从初始解开始(每个网络簇仅包含一个节点),在每次迭代中,FN方法执行使函数值最大化的合并操作,直到网络中只剩下一个网络簇。
(c)GA方法是Guimera和Amaral于2005年在《Nature》上提出的一种基于模拟退火方法的复杂网络聚类方法。该方法从初始解开始,在每次迭代中,产生、评价、接受或拒绝由当前解产生的候选解。产生候选解的策略是将节点移动到其他簇、交换不同簇的节点、分解网络簇或合并网络簇。
(3)启发类方法:最大流社团(简称MFC)方法、Girvan-Newman(简称GN)方法、Wu-Huberman(简称WH)方法和派系过滤(简称CPM)方法是典型的启发式复杂网络聚类方法。这类方法的共同特点是:基于某些直观的假设来设计启发式方法,对于大部分网络,它们能够快速地找到最优解或者近似最优解。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于石家庄铁道大学,未经石家庄铁道大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201610068175.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种可光磁识读的条形码编码方法
- 下一篇:信息识别的方法和装置