[发明专利]混合蛙跳算法的自适应核k‑means方法与系统在审
申请号: | 201710201837.6 | 申请日: | 2017-03-30 |
公开(公告)号: | CN106991442A | 公开(公告)日: | 2017-07-28 |
发明(设计)人: | 丁世飞;樊淑炎;王小玉 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 221116 江苏省*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明是一种混合蛙跳算法的自适应核k‑means方法与系统,涉及数据挖掘和聚类分析领域,特别涉及一种混合蛙跳算法的自适应核k‑means方法与系统。所要解决的问题是利用混合蛙跳算法优化核参数和聚类数,最后利用核k‑means得到有效的聚类结果。本发明包括以下步骤首先导入数据,初始化青蛙种群。使用核k‑means进行聚类计算KBWP,将KBWP看作混合蛙跳算法的适应度。然后进行局部搜索及全局搜索,同时优化最差适应度的青蛙信息。最后当全局最优青蛙的适应度的相对改变小于预定义的值或迭代次数达到预定义的值,优化结束,输出聚类结果。基于混合蛙跳算法的自适应核k‑means能够根据数据集的内在结构能自动确定聚类数目和合适的核参数,最后得到有效的聚类结果。 | ||
搜索关键词: | 混合 蛙跳 算法 自适应 means 方法 系统 | ||
【主权项】:
混合蛙跳算法的自适应核k‑means方法与系统,其特征是:根据数据的结构特征,设计了一种适用于核空间的聚类有效性指标KBWP(Kernel Between‑Within Proportion),将该指标作为适应度,利用混合蛙跳算法同时优化聚类数和核参数,聚类过程中无需人工介入,最终得到适于当前数据的聚类结果,该方法具体如下:步骤1:导入数据集,随机初始化青蛙种群Xi,i=1,2,...,F,青蛙的位置信息表示优化参数,使用核k‑means进行聚类并计算KBWP;步骤2:随机选取k个初始聚类中心,将其他数据点划分到距离其最近的聚类中心所属的类,得到k个初始类{c1,c2,…,ck};步骤3:根据计算得到新的聚类中心,更新每个类ci=(x∈D|i=argminj=1,2,...,k||Φ(x)‑mj||),Φ是映射函数;步骤4:重复步骤3,直到每个类不再发生改变,一次核k‑means方法结束;步骤5:根据计算类内距离,表示第i个类中第q个数据点且q≠j,表示第i个类中第j个数据点,ni表示第i个类中的数据点个数,w(i,j)表示第i个类中第j个数据点的类内距离;步骤6:根据计算类间距离,c和j表示聚类标签,表示第c类中的第p个数据点,nk表示第k个类中的数据点个数,b(i,j)表示第i个类中第j个数据点的最小类间距离;步骤7:根据计算KBWP指标值,根据计算AVG_KBWP;步骤8:基于KBWP的值,所有青蛙进行降序排序,被划分成m个子群,每个子群包含p只青蛙,F=m×p,其中,第一只青蛙进入第一个子群,第二只青蛙进入第二个子群,第m只进入第m个子群,第m+1只进入第一个子群;步骤9:在每个子群内,确定Xw,Xb和Xg。Xw和Xb分别代表最坏和最好位置的青蛙,具有全局最优适应度的青蛙被定义为Xg;步骤10:按照跳跃规则进行子群进化,最坏的青蛙Xw跳向最好的青蛙Xb;如果跳跃产生更优的解,代替最坏的青蛙;否则,最坏的青蛙被删除,按照约束条件S=rand(Xg‑Xw)随机产生新的青蛙来代替它;步骤11:局部搜索达到预定义的迭代次数后,将所有青蛙按照适应度值进行降序排序,记录具有全局最优适应度的青蛙Xg,按照步骤2重新划分子群,并进行局部优化;步骤12:当全局最优青蛙的适应度的相对改变小于预定义的值或迭代次数达到预定义的值,优化聚类数和核参数结束,输出聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710201837.6/,转载请声明来源钻瓜专利网。