[发明专利]一种基于密度峰值的混合属性数据聚类方法在审
申请号: | 201710294126.8 | 申请日: | 2017-04-28 |
公开(公告)号: | CN107103336A | 公开(公告)日: | 2017-08-29 |
发明(设计)人: | 刘世华;叶展翔;周炳忠;张浩 | 申请(专利权)人: | 温州职业技术学院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 温州名创知识产权代理有限公司33258 | 代理人: | 陈加利 |
地址: | 325000 浙江省温州市瓯海*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明实施例公开了一种基于密度峰值的混合属性数据聚类方法,包括获取待聚类混合属性数据集,并计算出待聚类混合属性数据集中每两个数据点之间的距离以及截断距离;根据每两个数据点之间的距离及截断距离,得到每一个数据点的局部密度,并计算出相对距离;定义由每一个数据点的局部密度及其相对距离形成的γ参数曲线,得到γ参数值;根据每一个数据点的序号、γ参数值及相对距离,构建拐点索引矩阵,并采用预设的双拐点算法得到聚类中心点;根据聚类中心点,实现待聚类混合属性数据集聚类结果的表示和输出。本发明实施例,比传统的k‑prototypes算法聚类效果好、算法效率高且能够自动发现聚类数目,对离群点的影响不敏感。 | ||
搜索关键词: | 一种 基于 密度 峰值 混合 属性 数据 方法 | ||
【主权项】:
一种基于密度峰值的混合属性数据聚类方法,其特征在于,所述方法包括:S1、获取待聚类混合属性数据集,并根据所述待聚类混合属性数据集,计算出所述待聚类混合属性数据集中每两个数据点之间的距离,以及计算出所述待聚类混合属性数据集的截断距离;S2、根据所述计算出的待聚类混合属性数据集中每两个数据点之间的距离以及所述计算出的截断距离,得到所述待聚类混合属性数据集中每一个数据点的局部密度,并进一步根据所述得到的待聚类混合属性数据集中每一个数据点的局部密度,计算出所述待聚类混合属性数据集中每一个数据点的相对距离;S3、定义由所述待聚类混合属性数据集中每一个数据点的局部密度及其对应的相对距离形成的γ参数曲线,并确定所述待聚类混合属性数据集中每一个数据点的γ参数值;S4、根据所述待聚类混合属性数据集中每一个数据点的序号、γ参数值及相对距离,构建拐点索引矩阵,并采用预设的双拐点算法对所述构建的拐点索引矩阵求解,得到所述待聚类混合属性数据集的聚类中心点;S5、根据所述得到的待聚类混合属性数据集的聚类中心点,实现所述待聚类混合属性数据集聚类结果的表示和输出;其中,所述待聚类混合属性数据集中除所述得到的聚类中心点之外的数据点将被分配到近邻局部密度最高的聚簇中,完成聚类结果的表示和输出。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于温州职业技术学院,未经温州职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710294126.8/,转载请声明来源钻瓜专利网。
- 上一篇:摄像机
- 下一篇:投影仪(201701)