[发明专利]一种改进的谱聚类及并行化方法在审
申请号: | 201810344423.3 | 申请日: | 2018-04-17 |
公开(公告)号: | CN108520284A | 公开(公告)日: | 2018-09-11 |
发明(设计)人: | 强保华;孙颢宁;王玉峰;谢武;韦二龙;史喜娜;赵兴朝 | 申请(专利权)人: | 桂林电子科技大学;中国电子科技集团公司第五十四研究所 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 广州市一新专利商标事务所有限公司 44220 | 代理人: | 滕杰锋 |
地址: | 541004 广西*** | 国省代码: | 广西;45 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于群智能算法的改进谱聚类方法,通过选取拉普拉斯矩阵的前2k个最大特征值对应的特征向量作为聚类的源数据,然后通过群智能算法选取优质的初始化中心点进行聚类操作,提高了聚类的最高准确率和多次聚类结果的稳定性。本发明引入了布谷鸟搜索算法寻找初始化中心点,将布谷鸟搜索算法过程中的适应度函数采用误差平方和函数,应用于谱聚类中,将搜索得到的最小的误差平方和的数据点作为初始化中心点。本发明将布谷鸟搜索算法中的莱维飞行策略引入粒子群算法,在粒子群算法收敛速度变缓情况下,使用莱维飞行策略产生频繁较小步长和和偶尔较大步长,在不同步长下引入不同侧重的速度更新公式。 | ||
搜索关键词: | 聚类 搜索算法 初始化 中心点 粒子群算法 误差平方和 飞行策略 智能算法 引入 矩阵 适应度函数 聚类操作 聚类结果 速度更新 特征向量 并行化 基于群 数据点 源数据 准确率 收敛 改进 搜索 应用 | ||
【主权项】:
1.一种改进的谱聚类及并行化方法,所述方法包括:选取拉普拉斯矩阵L的前2k个最大特征值对应的特征向量作为聚类的源数据,k为类簇数目;采用布谷鸟搜索算法寻找初始化中心点;所述采用布谷鸟搜索算法寻找初始化中心点包括如下步骤:(1)给定原始数据X=[x1,x2,x3,…,xn]∈Rd和聚类数目k;(2)根据下面公式计算拉普拉斯矩阵L:Aij=exp(‑|dij|2/2σ2),i≠j,Aii=0;
(3)计算拉普拉斯矩阵L的前2k个最大特征值的特征向量的规范化矩阵Y;(4)在矩阵Y中随机地初始化n个鸟巢的位置
(5)分别以n个鸟巢的位置作为聚类中心点进行聚类划分,计算每个鸟巢的适应度值F,并保留相对较小F值的鸟巢位置:Fbest=min{F1,F2,…,Fn};(6)按照布谷鸟搜索算法中的莱维飞行策略对鸟巢位置进行更新;(7)将更新位置后的鸟巢再次进行聚类划分,计算每个鸟巢的适应度,然后根据适应度对比新旧两代鸟巢,并对比上一代最小F值,保留相对较小F值鸟巢位置;(8)用随机数r∈[0,1]与发现概率Pa比较,若r<Pa,保留鸟巢位置;若r>Pa,则通过公式更新鸟巢位置,保留更新前后F值较小的鸟巢位置;(9)如果未达到最大迭代次数或设定的停止条件则返回步骤(5)继续执行;否则保留最小适应度值的解且进入下面步骤操作;(10)对获得的最优鸟巢位置进行K‑means聚类,最后输出聚类中心点和聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于桂林电子科技大学;中国电子科技集团公司第五十四研究所,未经桂林电子科技大学;中国电子科技集团公司第五十四研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810344423.3/,转载请声明来源钻瓜专利网。