[发明专利]基于L2范数规范化和余弦定理改进的肘部法则的方法在审

专利信息
申请号: 201711172384.5 申请日: 2017-11-22
公开(公告)号: CN108171253A 公开(公告)日: 2018-06-15
发明(设计)人: 付映雪;石聪明;王锋;邓辉;戴伟;卫守林 申请(专利权)人: 昆明理工大学
主分类号: G06K9/62 分类号: G06K9/62
代理公司: 暂无信息 代理人: 暂无信息
地址: 650093 云*** 国省代码: 云南;53
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于L2范数规范化和余弦定理改进的肘部法则的方法,属于数据挖掘中聚类分析技术领域。本发明包括设定K均值聚类算法中要搜索其最佳聚类数(最佳K值)的范围[Kmin‑Kmax];计算搜索范围内的Kmax‑Kmin+1个聚类数对应的平均畸变程度;对计算得到的Kmax‑Kmin+1个平均畸变程度进行L2范数规范化处理等步骤。本发明在K均值聚类算法及肘部法则的基础上,通过对肘部法则得到的平均畸变程度进行L2范数规范化处理及利用余弦定理对其进行进一步的计算,进而得到搜索范围内的最佳K值,该方法可以使得到的最佳K值更具有客观性。 1
搜索关键词: 肘部 范数 余弦定理 畸变 规范化 搜索 聚类 聚类分析 数据挖掘 改进
【主权项】:
1.一种基于L2范数规范化和余弦定理改进的肘部法则的方法,其特征在于:包括如下步骤:

(1)设定K均值聚类算法中要搜索最佳K值的范围[Kmin,Kmax];

(2)利用K均值聚类算法计算搜索范围[Kmin,Kmax]内的Kmax‑Kmin+1个聚类数对应的平均畸变程度;

(3)对计算得到的Kmax‑Kmin+1个平均畸变程度进行L2范数规范化处理;

(4)将L2范数规范化处理后的Kmax‑Kmin+1个平均畸变程度与搜索范围[Kmin,Kmax]内的Kmax‑Kmin+1个聚类数封装成Kmax‑Kmin+1个数据点;

(5)利用余弦定理求上述封装成的Kmax‑Kmin+1个数据点中每三个相邻数据点之间的夹角;

(6)找出步骤(5)求得夹角中的最小夹角;

(7)利用找到的最小夹角得到最优的K值。

2.根据权利要求1所述的基于L2范数规范化和余弦定理改进的肘部法则的方法,其特征在于:具体步骤如下:

Step1、设定K均值聚类算法中要搜索最佳K值的范围Range:[Kmin,Kmin+1,…,Kmax‑1,Kmax];

Step2、初始化聚类数k=Kmin,且生成一个长度为Kmax‑Kmin+1且所有元素为0的平均畸变程度列表MDL;

Step3、如果k∈Range,则执行Step4‑Step7;如果则跳过Step4‑Step7,执行Step8;

Step4、用k来实例化sklearn.cluster.KMeans得到实例对象kmeans;

Step5、通过实例对象kmeans对具有N个样本数据的数据集进行处理,并得到对应的k个聚类中心;

Step6、利用K均值聚类算法的优化目标函数、得到的k个聚类中心以及N个样本数据来求对应的平均畸变程度,并将求得的平均畸变程度追加到平均畸变程度列表中;

Step7、k=k+1,重新回到Step3;

Step8、生成一个长度为Kmax‑Kmin+1且所有元素为0的L2范数规范化处理后的平均畸变程度列表NMDL;

Step9、利用L2范数规范化对平均畸变程度列表中的Kmax‑Kmin+1个值进行处理,并将L2范数规范化处理后的平均畸变程度放入NMDL中;

Step10、将L2范数规范化处理后的Kmax‑Kmin+1个平均畸变程度与搜索范围[Kmin,Kmax]内的Kmax‑Kmin+1个聚类数封装成Kmax‑Kmin+1个数据点,并存入数据点列表PL中;

Step11、利用余弦定理求上述封装成的Kmax‑Kmin+1个数据点中每三个相邻数据点之间的夹角,并将求得的夹角存到夹角列表AL中;

Step12、找出AL中Kmax‑Kmin‑1个夹角中最小的夹角minA;

Step13、得到最小夹角minA在AL中的下标minAI,将minAI加上2即为在搜索范围[Kmin,Kmax]内找到的最佳K值。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于昆明理工大学,未经昆明理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201711172384.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top