[发明专利]基于L2范数规范化和余弦定理改进的肘部法则的方法在审
| 申请号: | 201711172384.5 | 申请日: | 2017-11-22 |
| 公开(公告)号: | CN108171253A | 公开(公告)日: | 2018-06-15 |
| 发明(设计)人: | 付映雪;石聪明;王锋;邓辉;戴伟;卫守林 | 申请(专利权)人: | 昆明理工大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 650093 云*** | 国省代码: | 云南;53 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 肘部 范数 余弦定理 畸变 规范化 搜索 聚类 聚类分析 数据挖掘 改进 | ||
1.一种基于L2范数规范化和余弦定理改进的肘部法则的方法,其特征在于:包括如下步骤:
(1)设定K均值聚类算法中要搜索最佳K值的范围[Kmin,Kmax];
(2)利用K均值聚类算法计算搜索范围[Kmin,Kmax]内的Kmax-Kmin+1个聚类数对应的平均畸变程度;
(3)对计算得到的Kmax-Kmin+1个平均畸变程度进行L2范数规范化处理;
(4)将L2范数规范化处理后的Kmax-Kmin+1个平均畸变程度与搜索范围[Kmin,Kmax]内的Kmax-Kmin+1个聚类数封装成Kmax-Kmin+1个数据点;
(5)利用余弦定理求上述封装成的Kmax-Kmin+1个数据点中每三个相邻数据点之间的夹角;
(6)找出步骤(5)求得夹角中的最小夹角;
(7)利用找到的最小夹角得到最优的K值。
2.根据权利要求1所述的基于L2范数规范化和余弦定理改进的肘部法则的方法,其特征在于:具体步骤如下:
Step1、设定K均值聚类算法中要搜索最佳K值的范围Range:[Kmin,Kmin+1,…,Kmax-1,Kmax];
Step2、初始化聚类数k=Kmin,且生成一个长度为Kmax-Kmin+1且所有元素为0的平均畸变程度列表MDL;
Step3、如果k∈Range,则执行Step4-Step7;如果则跳过Step4-Step7,执行Step8;
Step4、用k来实例化sklearn.cluster.KMeans得到实例对象kmeans;
Step5、通过实例对象kmeans对具有N个样本数据的数据集进行处理,并得到对应的k个聚类中心;
Step6、利用K均值聚类算法的优化目标函数、得到的k个聚类中心以及N个样本数据来求对应的平均畸变程度,并将求得的平均畸变程度追加到平均畸变程度列表中;
Step7、k=k+1,重新回到Step3;
Step8、生成一个长度为Kmax-Kmin+1且所有元素为0的L2范数规范化处理后的平均畸变程度列表NMDL;
Step9、利用L2范数规范化对平均畸变程度列表中的Kmax-Kmin+1个值进行处理,并将L2范数规范化处理后的平均畸变程度放入NMDL中;
Step10、将L2范数规范化处理后的Kmax-Kmin+1个平均畸变程度与搜索范围[Kmin,Kmax]内的Kmax-Kmin+1个聚类数封装成Kmax-Kmin+1个数据点,并存入数据点列表PL中;
Step11、利用余弦定理求上述封装成的Kmax-Kmin+1个数据点中每三个相邻数据点之间的夹角,并将求得的夹角存到夹角列表AL中;
Step12、找出AL中Kmax-Kmin-1个夹角中最小的夹角minA;
Step13、得到最小夹角minA在AL中的下标minAI,将minAI加上2即为在搜索范围[Kmin,Kmax]内找到的最佳K值。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711172384.5/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于分层聚类的均衡图像聚类方法
- 下一篇:图像标签确定方法、装置及终端





