[发明专利]基于自适应元胞遗传与优选模糊C‑均值的混合聚类算法在审

专利信息
申请号: 201611059068.2 申请日: 2016-11-25
公开(公告)号: CN106778826A 公开(公告)日: 2017-05-31
发明(设计)人: 揭丽琳;刘卫东 申请(专利权)人: 南昌航空大学
主分类号: G06K9/62 分类号: G06K9/62;G06N3/12
代理公司: 南昌市平凡知识产权代理事务所36122 代理人: 张文杰
地址: 330063 江*** 国省代码: 江西;36
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 自适应 遗传 优选 模糊 均值 混合 算法
【说明书】:

技术领域

发明涉及一种模糊聚类方法,尤其涉及一种基于自适应元胞遗传与优选模糊C-均值的混合聚类算法。

背景技术

随着计算机和存贮技术的迅速发展,人们可获取的数据量正以指数级的速度增长。面对海量的数据,如何利用计算机自动把数据按照某些主题分类到不同类别,提取有用的、相关性强的知识已变得日益重要。因此聚类技术就在数据挖掘、机器识别、图像分割、故障诊断和模式识别等许多领域得到广泛应用。聚类分析作为一种寻求数据自然聚集结构的重要方法,主要分为硬聚类和模糊聚类。硬聚类算法简单、耗时少,但不适合处理现实世界的聚类问题,而模糊聚类算法通过引入隶属度函数表征每个数据属于各个类别的程度,克服了硬聚类的局限性。模糊C-均值(fuzzy c-means,FCM)算法是应用最广泛的模糊聚类算法。

传统的模糊C-均值算法通过最小化目标函数得到每个数据点对所有类中心的隶属度,从而决定数据点的类属。但是由于这种聚类方法是基于单点梯度下降的原理,因此存在聚类结果较大程度地依赖于初始聚类中心,易陷入局部极值等问题。例如,文献【肖满生,文志诚,张居武,汪新凡.一种改进隶属度函数的FCM聚类算法[J].控制与决策.2015,30(12):2270-2274.】中所提出的方法。模糊C-均值算法要求一个样本对于各个聚类的隶属度之和满足归一化条件,从而导致算法对具有噪声、孤立点、非均衡分布的样本聚类有效性较低。上述方法主要依据隶属度的修正,没有较好地克服算法对聚类中心初始值的敏感性。近年来出现了运用遗传算法、粒子群优化、模拟退火、蚁群算法等进化算法提高模糊C-均值性能的聚类方法,例如,Nanda等[1]系统阐述新出现的基于现代启发式搜索算法的划分聚类方法,并指出这些启发式划分聚类算法在现实生活领域具有很大的实际应用价值。

而遗传算法具有操作简单、较强的全局收敛能力和广泛适用性的特点,已成为许多领域使用最广泛的搜索和优化工具,因此出现了一些基于遗传算法的模糊聚类算法。根据结合的方式不同,聚类方法分为采用遗传算法单独聚类的方式和遗传算法与模糊C-均值组合的聚类方式。而早期的聚类方法是采用遗传算法单独进行聚类的方式,例如,Hall等[2]利用遗传算法优化模糊C-均值的聚类目标函数。近年来,模糊聚类方法主要采用组合的方式,例如,Ding等[3]采用遗传算法优化初始聚类中心,并利用核模糊C-均值指导分类,以改善模糊C-均值的聚类性能;Ye等[4]通过动态调整量子旋转角和实施染色体变异等方式对量子遗传算法进行改进,并在此基础上研究分析基于改进量子遗传算法的模糊聚类算法性能。上述聚类方法的聚类准确性都高于传统的模糊C-均值。但是由于评价函数所需时间较长,导致计算复杂性高,从而限制了它们的实际应用,同时处理高度复杂的数据集时,由于过早丢失种群多样性而导致收敛到局部最优值。元胞遗传算法(Cellular genetic algorithm,CGA)是一种将元胞自动机与遗传算法有机结合的算法,它将遗传操作限制在相邻个体之间进行,降低高适应度个体的基因信息的传播速度,在保持种群多样性上具有明显优势,改善遗传算法全局收敛性能。但是由于元胞遗传算法限定个体之间的位置关系,个体之间信息交流也被限制在其邻域范围内,降低寻优搜索效率,所以优化速度一般较慢。而模糊C-均值收敛迅速,但容易陷入局部极值。显然如果充分利用元胞遗传算法的全局搜索能力和模糊C-均值算法的局部搜索能力,使两种算法有效地结合,可以设计聚类性能更优的模糊聚类算法。

发明内容

本发明所要解决的技术问题在于克服现有技术的不足,提供一种基于自适应元胞遗传与优选模糊C-均值的混合聚类算法,能够获得更精确的聚类结果和更高的聚类效率。

本发明具体采用以下技术方案解决上述技术问题。

一种基于自适应元胞遗传与优选模糊C-均值的混合聚类算法,其特征在于,该方法包括以下步骤:

步骤一、采用基于聚类中心的实值编码方式表达染色体,并利用Arnold Cat映射产生初始种群,依据模糊C-均值的聚类准则构造适应度函数;

步骤二、对于种群内的每个个体,分别解码得到各组聚类中心,分配隶属度、计算适应度值及种群的熵;

步骤三、加入改进的演化规则进行元胞状态的演化,并对每个个体进行选择、动态的交叉和基于熵的组合变异操作,得到新种群;

步骤四、判断模糊C-均值的融合时机,当达到条件则采用优选策略对该新种群内的个体进行选择,利用实施准则进行模糊C-均值迭代操作;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南昌航空大学,未经南昌航空大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611059068.2/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top