[发明专利]一种K近邻相似度优化的密度峰聚类方法在审
申请号: | 201710607140.9 | 申请日: | 2017-07-24 |
公开(公告)号: | CN107392249A | 公开(公告)日: | 2017-11-24 |
发明(设计)人: | 葛洪伟;朱庆峰;江明;李莉 | 申请(专利权)人: | 江南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种K近邻相似度优化的密度峰聚类方法(Density Peaks clustering Optimized by K Nearest Neighbor’s Similarity,DPCKS),主要解决了密度峰聚类算法(Density Peaks Clustering,DPC)无法处理流形数据聚类的问题。该方法采用新的函数计算点间相似度,然后寻找每个点的K近邻,利用K近邻对每个点分配时进行指向点检测,对于指向错误的点重新寻找它的指向点,最后剩余的点分配到指向点所在族类。本发明方法能够适用于流形数据聚类,具有更高的精度和适用范围,能满足实际工程应用的需求。 | ||
搜索关键词: | 一种 近邻 相似 优化 密度 峰聚类 方法 | ||
【主权项】:
K近邻相似度优化的密度峰聚类方法,包括:(1)计算所有点间距离,算出截断距离dc值,利用高斯函数:计算每个数据点的密度,然后利用函数:计算每个点到密度比它大的最近点的距离δ。其中,dij表示点i和点j的距离。对于全局密度最大的点,令δi=maxjdij。(2)根据每个点的ρ和δ值画出决策图,找出聚类中心。(3)根据函数:计算点间相似度,找到每个点的K近邻点。其中X=(x1,…,xd)和Y=(y1,…,yd)是d维空间中的两个向量,mi表示第i维上X和Y的平均值的绝对值。(4)所有的点按照密度从大到小排序,新建空数组Aq,Bq,并把聚类中心依次放入数组Aq。(5)按照密度从大到小的顺序,依次取点i,判断点i是否已经分配。如果已经分配,取下一个;如果未分配,则进行下一步。(6)判断点i是否是密度峰值点。如果不是,取下一个;如果是,判断点i与指向点j是否连通。如果连通,把点i放入数组Aq末尾;如果不连通,则把点i放入数组Bq末尾。(7)判断数组Bq是否为空,如果为空,则将剩余的点分配,结束;如果不为空,则分别从数组Aq中找出一个点j,从数组Bq中找出一个点h,满足点j与点h距离最近。(8)判断点h与点j是否连通,如果连通,则点h的指向点为点j,把点h归入点j所在族类,并将点h加入数组Aq末尾,并从数组Bq中删除点h;如果不连通,寻找下一对最近点,判断。重复,直到数组Bq为空或者数组Bq中剩余点都不与数组Aq中的点连通。(9)判断数组Bq是否为空,如果为空,则将剩余的点分配给指向点,结束;如果不为空,则从数组Bq中找出点t,从数组Aq中找出点j,满足点t与点j距离最近,将点t指向点j,并将点t加入数组Aq末尾,从数组Bq中删除点t,重复,直到数组Bq为空。(10)将剩余的点分配给指向点,结束。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710607140.9/,转载请声明来源钻瓜专利网。