[发明专利]基于量子粒子群优化改进的模糊C-均值聚类方法有效
申请号: | 201210277058.1 | 申请日: | 2012-08-06 |
公开(公告)号: | CN102831474A | 公开(公告)日: | 2012-12-19 |
发明(设计)人: | 毛力;李引 | 申请(专利权)人: | 江南大学 |
主分类号: | G06N3/00 | 分类号: | G06N3/00 |
代理公司: | 无锡市大为专利商标事务所 32104 | 代理人: | 曹祖良 |
地址: | 214122 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种聚类方法,尤其是一种基于量子粒子群优化改进的模糊C-均值聚类方法,属于数据挖掘和人工智能的技术领域。本发明在传统的模糊C-均值聚类算法中,首先利用新距离标准取代Euclidean标准,以提高传统聚类算法下的模糊精确度,同时通过AFCM算法单次快速分类替代随机分配初始聚类中心,来降低聚类算法对初始聚类中心的敏感度,最后在聚类过程中引入基于距离改进的QPSO(AQPSO)并行优化思想使其聚类算法具有较强的全局搜索能力、更高的收敛精度,保证收敛速度也明显改善了聚类效果。 | ||
搜索关键词: | 基于 子粒 子群 优化 改进 模糊 均值 方法 | ||
【主权项】:
1.一种基于量子粒子群优化改进的模糊C-均值聚类方法,其特征是,所述模糊C-均值聚类方法包括如下步骤:步骤一、聚类参数设定:给定所需的聚类类别c、粒子群规模N、最大迭代次数MAXTER,当前迭代次数t,收缩扩张系数α;步骤二、种群的初始化:定义距离标准d(xk,vi)=1-exp(-β||xk-vi||2) (1)其中,β = [ 1 n ( Σ k = 1 n | | x k - x ‾ | | ) ] - 1 , ]]> 且x ‾ = 1 n ( Σ k = 1 n x k ) ; ]]> 利用单次AFCM算法进行快速分类,结合公式(1)得到目标函数J AFCM ( X , U , V ) = Σ i = 1 c Σ k = 1 n U ik m [ 1 - exp ( - β | | x k - v i | | 2 ) ] - - - ( 2 ) ]]> 其中,X={x1,x2,…xk,…xn}是给定的数据集,n为数据集中样本的个数,xk(xk1,xk2,…,xkd)表示具有d个属性的数据对象,聚类个数为c,聚类中心集合V={v1,v2,…,vc},其中vi(vi1,vi2,…,vid)表示第i个聚类中心,Uik表示第k个样本属于第i类的模糊隶属度,对于任意k,i和模糊加权指数m,使公式(2)达到最小值的必要条件为:U ik = 1 Σ j = 1 c { [ 1 - exp ( - β | | x k - v i | | 2 ) ] / [ 1 - exp ( - β | | x k - v j | | 2 ) ] } 1 / m - 1 , 1 ≤ i ≤ c , 1 ≤ k ≤ n - - - ( 3 ) ]]> 中心向量为:v i = Σ k = 1 n U ik m ( exp ( - β | | x k - v i | | 2 ) ) x k Σ k = 1 n U ik m ( exp ( - β | | x k - v i | | 2 ) ) - - - ( 4 ) ]]> 利用公式(4)得到的聚类中心向量作为种群中的一个初始粒子,并重复进行N次,生成初始种群;步骤三、粒子的全局搜索:在一个d维的目标搜索空间中,QPSO算法由N个代表潜在问题解的粒子组成群体X(t)={X1(t),X2(t),…,XN(t)},在t时刻,第i个粒子位置为
粒子没有速度向量,个体最优位置Pbest表示为pi(t)=(pi1(t),pi2(t),…,pid(t)),全局最优位置Gbest表示为G(t)=(G1(t),G2(t),…,Gj(t)…,Gd(t)),且G(t)=pg(t),其中g为粒子群体处于全局最优位置的下标,g∈{1,2,…,N};定义所有粒子个体的最优平均位置C(t),即C ( t ) = ( C 1 ( t ) , C 2 ( t ) , . . . C j ( t ) , . . . C d ( t ) ) ]]>= 1 N Σ i = 1 N p i ( t ) = ( 1 N Σ i = 1 N p i 1 ( t ) , 1 N Σ i = 1 N p i 2 ( t ) , . . . , 1 N Σ i = 1 N p ij ( t ) , . . . , 1 N Σ i = 1 N p id ( t ) ) - - - ( 6 ) ]]> 粒子的个体最优位置Pbest由下述公式确定为p i ( t ) = X i ( t ) f [ X i ( t ) ] < f [ p i ( t - 1 ) ] p i ( t - 1 ) f [ X i ( t ) ] ≥ f [ p i ( t - 1 ) ] - - - ( 7 ) ]]> 其中,f[X]=JAFCM(X,U,V);整个粒子群的全局最优位置Gbest由下述公式确定为g = arg Min 1 < i ≤ N { f [ p i ( t ) ] } - - - ( 8 ) ]]> G(t)=Pg(t) (9)更新粒子时,首先得到粒子的个体最优位置Pbest及整个粒子群的全局最优位置Gbest,其次利用公式(2)更新所有粒子个体的适应度值,并将每一个粒子的当前个体位置适应度值与全局最优位置的适应度值比较;若每一个粒子的当前个体位置适应度值优于全局最优位置的适应度值,更新公式(9)中的G(t);令
则粒子的进化方程为:X i , j ( t + 1 ) = P i , j ( t ) ± α * | C j ( t ) - X i , j ( t ) | * ln ( 1 u i , j ( t ) ) , u i , j ( t ) ~ U ( 0,1 ) - - - ( 11 ) ]]> 其中,
ui,j(t)为符合正态分布的辅助参数;Gj(t)表示粒子群体的全局最优位置;步骤四、输出聚类结果:重复上述粒子更新操作,如果当前的迭代次数达到预先设定的最大次数MAXTER,则停止迭代输出最佳聚类效果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210277058.1/,转载请声明来源钻瓜专利网。