[发明专利]一种基于相对最离散维分割的K‑means聚类初始中心选取方法在审
申请号: | 201710844898.4 | 申请日: | 2017-09-19 |
公开(公告)号: | CN107704872A | 公开(公告)日: | 2018-02-16 |
发明(设计)人: | 吴造林;胡长俊 | 申请(专利权)人: | 安徽理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F17/30 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 232001 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于相对最离散维分割的K‑means聚类初始中心点选取的方法。该方法思路为给定一个D维的数据集,s1.对数据集进行降维处理;s2.评估降维后的数据集每个维度的离散程度;s3.选择相对最离散维进行分割,依照该维均值点将所有数据分为两类;s4.选取进行分割后的类别中数据点最多的一类,按照s2和s3选取相对最离散维,将其继续按照最离散维均值点处进行分割,依照上述步骤直到分割为所需的类别数为止;s5.对每个分割好的类别中数据求均值;s6.将每个类别的均值进行升维操作,并作为K‑means聚类的初始中心点。本发明的有益效果是降维后的数据能减少运算量,加快运算速度,使得K‑means聚类能够以更少的迭代次数达到更高的聚类准确率。 | ||
搜索关键词: | 一种 基于 相对 离散 分割 means 初始 中心 选取 方法 | ||
【主权项】:
一种K‑means聚类中心点初始化方法,其特征在于,该方法包括:对任意给定的D维含N个数据的数据集,将该数据集变换为一组各维之间线性无关的表示,可用于提取该数据集的主要特征分量,即对该数据集进行降维。然后对于该数据集选取相对最离散维根据均值点进行分割,分割后得到所需的聚类类别数后,再对每个分割出的类别求均值,并进行升维操作后的数据点作为K‑means聚类的初始中心点。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽理工大学,未经安徽理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710844898.4/,转载请声明来源钻瓜专利网。
- 上一篇:设置自启动权限的方法、装置及存储介质
- 下一篇:一种壁纸设置方法及终端