[发明专利]基于Hadoop分布式计算的MS-Kmeans聚类方法、装置在审
申请号: | 202310415443.6 | 申请日: | 2023-04-18 |
公开(公告)号: | CN116484246A | 公开(公告)日: | 2023-07-25 |
发明(设计)人: | 李凯;李国栋;王春红;杨大伟;马军;胡美慧;万姣;马天福;马斌 | 申请(专利权)人: | 国网新疆电力有限公司信息通信公司;华北电力大学;国家电网有限公司 |
主分类号: | G06F18/23213 | 分类号: | G06F18/23213;G06F16/182 |
代理公司: | 乌鲁木齐合纵专利商标事务所 65105 | 代理人: | 俞亮 |
地址: | 830001 新疆维吾尔*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种数据聚类技术领域,是一种基于Hadoop分布式计算的MS‑Kmeans聚类方法、装置,包括:搭建Hadoop集群;将总数据集平分为若干子数据集;执行Hadoop分布式文件命令,上传总数据集和子数据集至Hadoop分布式文件系统,利用Mean Shift算法分别对每个子数据集进行聚类,得到多个候选中心向量;选择K个相距最远的候选中心向量作为中心向量,利用K‑means聚类算法对总数据集中的所有数据进行聚类本发明能将MS‑Kmeans聚类算法运行在Hadoop分布式文件系统中,且集合Mean Shift算法和K‑means聚类算法的优点,在提高了聚类性能的同时有效减少了聚类运行时间。 | ||
搜索关键词: | 基于 hadoop 分布式 计算 ms kmeans 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网新疆电力有限公司信息通信公司;华北电力大学;国家电网有限公司,未经国网新疆电力有限公司信息通信公司;华北电力大学;国家电网有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310415443.6/,转载请声明来源钻瓜专利网。