[发明专利]群体智能算法中的自适应调整聚类中心标号方法在审

专利信息
申请号: 201910562653.1 申请日: 2019-06-26
公开(公告)号: CN110347829A 公开(公告)日: 2019-10-18
发明(设计)人: 胡晓敏;王明丰;李瑞珠;李敏;罗玉 申请(专利权)人: 广东工业大学
主分类号: G06F16/35 分类号: G06F16/35;G06K9/62;G06N3/00
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510006 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 聚类中心 自适应调整 维度 群体智能算法 种群个体更新 相似度矩阵 进化算法 群体智能 双向选择 随机排列 不一致 相似度 最大化 聚类 两组 算法 种群 搜索 淘汰 保证
【说明书】:

发明公开了一种基于两组聚类中心相似度矩阵的自适应调整聚类中心标号的方法,用于解决群体智能进化算法在采用基于划分的形式进行聚类时,构造的种群中个体间各聚类中心随机排列导致的聚类中心标号不一致,即属于不同簇集的聚类中心却排列在同一维度的问题而导致算法种群个体更新效率低下和搜索盲目性的问题。所提出方法采用一种双向选择的竞争淘汰策略,将个体间相似度最大,距离最接近的聚类中心尽量排列在同一维度,保证聚类中心标号一致性的最大化。

技术领域

本发明涉及聚类算法和群体智能进化算法领域,更具体地,涉及一种群体智能算法中的自适应调整聚类中心标号的方法。

背景技术

文本聚类在文本挖掘领域起着至关重要的作用,对互联网和实际生产环境中的海量文本数据进行有效组织和划分,从中发掘隐藏的有价值信息一直是企业或者政府机构常见的需求之一。文本是保存信息最自然的方式,它是一种特殊的非结构化数据,具有维度高、特征稀疏和数据关联性低的特点。目前常用的聚类算法,例如K-means,K-means++等对初始聚类中心的选取具有很高的敏感性,并且调整聚类中心的方式也使得算法容易陷入局部最优解。

群体智能进化算法是一类适应性和全局搜索能力更强的最优化算法,这种类型的算法一般需要通过构建一定数目的种群,种群中的个体一般表示待解决问题的一种解决方案。然后种群基于一定规则进行经验交流来更新种群,产生适应度更好的后代种群。迄今为止,许多群体智能进化算法及其改进算法被提出来用于解决文本聚类问题,例如粒子群优化算法(PSO),量子粒子群优化算法(QPSO),差分进化算法(DE)和遗传算法(GA)等,当采用基于聚类中心进行样本划分的编码方式进行聚类时,这些算法构建的种群中的个体被抽象成用来划分样本的一组聚类中心。传统的研究者将这些应用到文本聚类问题时,极少考虑种群个体间各维度上聚类中心向量的随机排列问题,即各维度上特征属性不一致对种群更新效率的影响。这些算法在迭代更新过程中,种群个体各聚类中心的位置是随机排列的,当涉及到个体间的交叉更新操作时,如果处于同一维度上却属于不同簇集上的聚类中心向量之间进行加减操作时,势必影响种群的更新效率而产生适应度更差的个体,甚至误导种群朝着脱离最优解的方向搜索,比如有两个个体分别表示为xi={b1,c1,a1}和xj={a2,b2,c2},其中字母相同表示聚类中心向量相同或非常接近。可以看出这两个个体聚类中心相似度较大但标号错开,这种情形下粒子间聚类中心向量进行交叉更新操作时,所产生的差分向量xj-xi则不起引导作用,甚至误导个体的搜索行为。因此聚类中心向量排列的随机性,即标号不一致的现象会严重影响进化算法的更新效率和朝最优解优化的方向。

发明内容

针对群体智能进化算法在求解聚类问题最优聚类中心过程中,种群个体各聚类中心标号不一致而引起的算法更新效率不理想的问题,本发明提供一种群体智能算法中的自适应调整聚类中心标号的方法,来改善群体智能进化算法在文本聚类过程中的更新效率和全局搜索能力。

为解决上述技术问题,本发明的技术方案如下:

一种群体智能算法中的自适应调整聚类中心标号的方法,用于改善群体智能进化算法在进行文本聚类时的更新效率和全局搜索能力,包括以下步骤:

S1:设定一个以其聚类中心标号为基准的个体xj,另一个待调整聚类中心标号的个体为xi,计算个体xj与个体xi中各聚类中心的相似度矩阵M;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910562653.1/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top