[发明专利]一种反馈式密度峰值聚类方法及系统在审
申请号: | 201710131145.9 | 申请日: | 2017-03-07 |
公开(公告)号: | CN107016407A | 公开(公告)日: | 2017-08-04 |
发明(设计)人: | 丁世飞;徐晓;杜明晶;贾洪杰;徐丽;胡乾坤 | 申请(专利权)人: | 中国矿业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 221116 江苏省徐*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出一种反馈式密度峰值聚类方法及系统,所要解决的问题是原密度峰值算法在一个类中出现多密度峰值时会被分成多个类。同时提高原算法在高维数据集上准确率。本发明包括以下步骤1.用非负矩阵分解对数据集进行特征提取;2.根据原密度峰值聚类算法绘制决策图,选择多个聚类中心;3.用“最近邻”算法分配剩下的点,并去除噪声点;4.用SVM反馈每两个类之间的聚类结果;5.根据反馈的结果将可以合并的类进行合并;该方法不仅能够有效提高密度峰值算法的鲁棒性,很好地发现任意形状的簇,并能有效处理高维数据,具有很好的聚类效果。 | ||
搜索关键词: | 一种 反馈 密度 峰值 方法 系统 | ||
【主权项】:
一种反馈式密度峰值聚类方法及系统,其特征在于,利用非负矩阵分解对数据集进行降维,然后基于密度峰值聚类算法对数据进行初始聚类,再根据反馈策略合并类,得出聚类结果,该方法具体包括:步骤1:用非负矩阵分解对数据集进行特征提取;步骤2:构造距离矩阵dij;步骤3:利用计算每个数据点的局部密度ρi;步骤4:利用计算每个数据点的距离属性δi;步骤5:根据上述求出的局部密度属性ρi和距离属性δi,绘制决策图,取两个属性值都高的数据点作为聚类中心;步骤6:将剩余点归于密度等于或者高于当前点的最近点一类;步骤7:计算出当前类别的边界,然后找出边界中密度最高点的密度作为阈值,去除当前类别中小于此密度的点;步骤8:用SVM对每两个类进行训练,反馈一个结果值;步骤9:根据反馈值对类进行合并,得出聚类结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国矿业大学,未经中国矿业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710131145.9/,转载请声明来源钻瓜专利网。