[发明专利]基于局部模块度的遗传算法用于大规模复杂网络社区挖掘的方法有效

专利信息
申请号: 201310080090.5 申请日: 2013-03-13
公开(公告)号: CN103208027A 公开(公告)日: 2013-07-17
发明(设计)人: 杨新武;李瑞 申请(专利权)人: 北京工业大学
主分类号: G06N3/12 分类号: G06N3/12
代理公司: 北京思海天达知识产权代理有限公司 11203 代理人: 张慧
地址: 100124 *** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 局部 模块 遗传 算法 用于 大规模 复杂 网络 社区 挖掘 方法
【说明书】:

技术领域

发明属于复杂网络社区挖掘技术领域,具体涉及一种基于局部模块度的遗传算法用于大规模复杂网络社区挖掘的方法,是一种利用计算机技术、遗传算法等实现复杂网络社区挖掘的方法。

背景技术

复杂网络是复杂系统的典型表现形式,社区结构是复杂网络最重要的结构特征之一。在复杂网络中检测出有意义的社区,对网络建模和分析作用重大。社区结构是复杂网络的一种介于宏观和微观之间的结构特性,是网络结点的一种相似性组织方式。社区内部结点间的连接密度高于社区之间的连接密度是社区结构的关键特征。在复杂网络中探测出社区结构,在复杂网络的拓扑结构分析、功能分析和行为预测方面都具有重要的理论和实用价值,并在生物网、科技网和社会网中具有广泛的应用前景,已被应用于恐怖组织识别、新陈代谢途径预测、蛋白质相互作用网络分析、Web社区挖掘等众多领域。

社区结构发现就是辨识网络社区的过程,网络中的社区通常具有某种存在于该社区结点之间的相似性。在万维网中,通过某一社区少数Web页面信息的获取,就可以推测该社区其他Web页面的信息;在社会网络中,人们按照职业、兴趣、居住地址等特征形成自然的团体,团体内部成员拥有相对密切的相互关系;在生物分子相互作用网络中,将结点划分成功能模块有助于辨识单个分子的功能。发现网络的社区结构,能够帮助人们深刻地理解和认识网络结构与其功能之间的关系。

如何快速、高效地在大规模复杂网络上探测出潜在的社区成为当前研究复杂网络的热点问题。关于复杂网络挖掘技术,比较经典的传统算法有KL(Kernighan-Lin)算法,GN(Girvan-Newman)算法,模拟退火算法(Simulated Annealing,简称SA算法)、快速Newman算法(简称FN算法),这些算法有效率太低、需要先验知识、收敛速度很慢、易陷入局部最优解等缺点。2004年Newman网络模块度函数的提出,将复杂网络挖掘问题转化为一种优化问题,诸多以网络模块度作为目标函数的优化算法出现,然而它却是一种完全NP问题(Nondeterministic Polynomial Time-Complete Problem,多项式复杂程度的非确定性问题),难以实现。遗传算法(Genetic Algorithm,简称GA算法)作为一种优化算法,很好地解决了这个问题。当前具有代表性的算法是何东晓提出的CCGA算法,在此算法中,全局搜索算子使用聚类融合的交叉算子,局部搜索算子采用迫使变异结点与其大多数邻居结点在同一社区内的变异算子,获得了不错的效果,然而其算法的时间复杂度较高,为O(n2),不太适用于大规模复杂网络。

发明内容

为了解决复杂网络社区挖掘方法中存在的时间复杂度高、收敛速度慢等问题,本发明提供了一种基于局部模块度的遗传算法用于大规模复杂网络社区挖掘(Genetic Algorithm with Local Modularity for Community Detecting,简称LMGACD)的新方法。

本发明采用的技术方案如下:

在遗传算法的变异算子中,根据弱社区的定义引入了局部模块度,选择使变异结点变异为能使局部模块度增加最大的邻居结点,强化了变异算子的局部搜索能力,有针对性地缩小了候选解空间,提高了遗传算法的搜索性能。另外,在有利于搜索空间迁移的均匀交叉算子中加入轮盘赌选择,确保适应度高的个体具有优先选择权,加速最优解的产生,提高了算法的搜索效率。

一种基于局部模块度的遗传算法用于大规模复杂网络社区挖掘方法,其特征在于包括以下步骤:

步骤一,对网络社区划分进行编码,方法如下:

使用基于基因座邻接的编码来表示由若干个网络社区划分组成的种群中的一个个体,即用一个个体的编码表示一个网络社区划分的结果。

在基于基因座邻接的编码表示中,每个基因型g都有n个基因,每个基因都代表了网络N中的一个结点。每个基因i都可以取一个j(j∈(1,2,...n))作为它的等位基因,即i和j之间存在一条连接。基于基因座邻接的编码表示是一种图表示方法,基因型g所表示的图中若i和j之间存在一条边,同时说明了基因型g解码后结点i与j在同一个社区。

步骤二,种群初始化,方法如下:

在确定表示网络社区划分的编码后,如果个体中的基因随机选择网络内的一个结点作为它的等位基因,将会生成很多无效的社区划分结果,降低算法的搜索效率。因此本算法中,个体中的任意一个基因选择它的邻居结点作为其等位基因生成种群的个体,在很大程度上减少了社区划分解的搜索空间。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京工业大学,未经北京工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201310080090.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top