[发明专利]一种基于多点张力模型的快速聚类方法在审
申请号: | 201710364512.X | 申请日: | 2017-05-22 |
公开(公告)号: | CN107194425A | 公开(公告)日: | 2017-09-22 |
发明(设计)人: | 屈洪春;吕强;蔡林沁;唐晓铭;王平 | 申请(专利权)人: | 重庆邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 北京同恒源知识产权代理有限公司11275 | 代理人: | 廖曦 |
地址: | 400065 *** | 国省代码: | 重庆;85 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 多点 张力 模型 快速 方法 | ||
技术领域
本发明属于聚类分析技术领域,涉及一种基于多点张力模型的快速聚类方法。
背景技术
聚类分析是一种重要的无监督学习方法,在数据的内在结构识别方面起到了不可替代的作用。聚类是根据数据对象相似度,把未知分类的数据集分割成不同的类或簇,使同一簇内的数据对象具有最大相似性,不同簇间的数据对象具有最小相似性。聚类分析在机器学习、模式识别、数据挖掘、图像处理等领域已经得到了广泛研究和应用。
K-means算法是最经典的聚类算法之一,其简单、高效,具有良好的局部搜索能力,得到了广泛应用及研究。但存在过于依赖初始聚类中心、容易陷入局部最优等缺陷。近年来,群体智能算法以其良好的全局寻优能力得到越来越多的关注,并成功运用到聚类分析领域。许多学者针对初始聚类中心的选取进行不同的改进,在一定程度上改善了聚类效果,提高了算法聚类结果的质量,但仍可能陷入局部最优。
发明内容
有鉴于此,本发明的目的在于利用人工蜂群算法模型,提供一种基于多点张力模型的快速聚类方法,利用当前全局最优解和次优解,并结合物理学的张力模型,使可能会陷入局部最优的解移动到更加合理的位置,避免算法陷入局部最优。该聚类方法在全局搜索阶段,引入丢弃算子使算法跳出局部最优。在局部搜索阶段,结合遗传算法中的交叉算子和变异算子提高了算法收敛速度和解的多样性。该聚类方法适用不同规模、多种类型的数据集,具有较强的伸缩性和健壮性。
为达到上述目的,本发明提供如下技术方案:
一种基于多点张力模型的快速聚类方法,包括以下步骤:
步骤一:初始阶段,从UCI数据集库中选取某个数据集,设定控制参数的值后,选取一定数量的蜜源,一个蜜源代表一个解,蜜源的质量代表解的适应度;将蜜源随机分布在空间中,蜜源的位置即为聚类中心位置;
步骤二:引领蜂先在蜜源邻域搜索新的解,搜索方式按照公式Vi=Xi+Ri(Xi-Xh)进行,其中i,h∈{1,2,…,N},N表示初始解的数量,Vi是新的蜜源,Xi是旧蜜源,Ri是[-1.1]内的随机数;如果Vi的适应度比Xi高,则替代Xi,否则Xi保持不变;
步骤三:当所有引领蜂完成搜索行为后,评估所有解的适应度,跟随蜂按照概率值Pi选择新的蜜源,Pi根据公式计算,其中i∈{1,2,…,N},N表示初始解的数量,fi表示第i个解的适应度;Pi与随机数r比较,若Pi<r,则跟随蜂在蜜源邻域结合变异算子搜索新的解,搜索方式按照公式Xi'=Xi+α1(Xbest-Xi)+β1(Xp-Xq)进行,其中Xi'表示Xi更新后的解,Xbest为当前最好的解,p,q∈[1,N]之间的随机整数,α1,β1服从均匀分布;
步骤四:引入交叉算子增加解的多样性,使算法更容易跳出局部最优,其中i,k=1,2,…,N,Cr是交叉率,设Cr=0.15;
步骤五:若某个解Xs经过Limit次迭代后没有找到更合适的解来替代它,则该Xs将被丢弃;重新评估所有解的适应度;引入丢弃算子并结合物理学的张力模型使算法跳出局部最优,使陷入局部最优的解Xs移动到更加合理的位置;选择当前最好的解Xg和次好解Xb,找到Xg和Xb的中间位置Xc=(Xg+Xb)/2;对Xc进行反射拓展得到新的解Xr的位置Xr=Xc+α2(Xc-Xs),其中α2是反射系数,设α2为1;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710364512.X/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种甲醛捕捉剂及其制备方法
- 下一篇:一种焦炉烟气脱硫脱硝方法以及设备