[发明专利]分布式k均值数据聚类方法在审
| 申请号: | 201811397113.4 | 申请日: | 2018-11-20 |
| 公开(公告)号: | CN109583488A | 公开(公告)日: | 2019-04-05 |
| 发明(设计)人: | 秦家虎;付维明;朱英达;马麒超;王帅 | 申请(专利权)人: | 中国科学技术大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李坤 |
| 地址: | 230026 安*** | 国省代码: | 安徽;34 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 同步传感器 传感器节点 聚类中心 均值数据 聚类 网络 初始聚类中心 一致性算法 距离最近 数据分割 数据归类 算法确定 传感器 收敛 正规化 存储 消耗 通讯 重复 更新 应用 | ||
1.一种分布式k均值数据聚类方法,用于处理同步传感器网络的数据,该同步传感器网络包含多个传感器节点,包括:
步骤A:对同步传感器网络中各个传感器节点内的数据进行正规化;
步骤B:基于分布式k++算法确定该同步传感器网络的初始聚类中心;
步骤C:计算各个聚类中心与传感器节点所存储的数据之间的距离,并将数据归类给距离最近的聚类中心所代表的类别;
步骤D:在整个同步传感器网络中执行平均一致性算法更新聚类中心;
步骤E:重复步骤C和步骤D直至聚类中心的值收敛。
2.根据权利要求1所述的分布式k均值数据聚类方法,在执行所述步骤A前,若同步传感器网络的拓补结构是有向图,且权值不平衡,则执行镜像不平衡修正算法修正边的权值使图平衡。
3.根据权利要求1所述的分布式k均值数据聚类方法,所述步骤A中,将传感器节点中数据各个维度的值放缩到[0,1]之间。
4.根据权利要求3所述的分布式k均值数据聚类方法,所述步骤A包括:
步骤A1:在整个同步传感器网络中执行max-consensus算法找到存储于各个传感器节点中的数据各个维度的最大值,以[maxl,...,maxd]’的形式存储于各个传感器节点中;
步骤A2:在整个同步传感器网络中执行min-consensus算法找到存储于各个传感器节点中的数据各个维度的最小值,以[minl,...,mind]’的形式存储于各个传感器节点中;
步骤A3:在传感器i中,利用下式,从j=1到d,计算正规化的数据值:
xij=(xij-minj)/(maxj-minj)
其中,d表示数据的维度,i表示第i个传感器节点,j表示数据xi的第j分量。
5.根据权利要求3所述的分布式k均值数据聚类方法,所述步骤B中:对整个同步传感器网络执行分布式k++算法得到k个初始的聚类中心,以变量c(1)=[cl(1)’,...,ck(1)’]’的形式存储于各个传感器节点内;
其中,(1)表示当前迭代步为1。
6.根据权利要求5所述的分布式k均值数据聚类方法,所述步骤B包括:
步骤B1:每个传感器节点均生成一个(0,1)之间的随机数tempi;
其中,i是传感器节点下标;
步骤B2:若当前初始聚类中心个数为0,对tempi执行max-consensus算法;
否则,每个传感器节点计算本地数据到各个已有的聚类中心的距离,并找出最小值,记为di,计算tempi=di2×tempi,再对tempi执行max-consensus算法,将结果以变量temp的形式存储于各个传感器节点中;
步骤B3:在传感器i中,如果tempi==temp,置xic=xi,否则,置xic=[-∞,...,-∞]’;
其中xi是传感器节点i所存储数据;
步骤B4:对xic执行max-consensus算法,将结果以cm(1)的形式存储于传感器节点i内;
其中,m表示所产生的第m个聚类中心;
步骤B5:如果已有聚类中心个数达到预设值k,则分布式k++算法结束,否则m+1并返回步骤B1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811397113.4/1.html,转载请声明来源钻瓜专利网。





