[发明专利]分布式模糊c均值数据聚类方法在审
申请号: | 201811397114.9 | 申请日: | 2018-11-20 |
公开(公告)号: | CN109299750A | 公开(公告)日: | 2019-02-01 |
发明(设计)人: | 秦家虎;朱英达;付维明;马麒超;陈宇航 | 申请(专利权)人: | 中国科学技术大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F16/953 |
代理公司: | 中科专利商标代理有限责任公司 11021 | 代理人: | 李坤 |
地址: | 230026 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 同步传感器 传感器节点 聚类中心 均值数据 聚类 网络 模糊 初始聚类中心 一致性算法 数据分割 算法确定 隶属度 传感器 收敛 正规化 存储 消耗 通讯 重复 更新 应用 | ||
本公开提供一种分布式模糊c均值数据聚类方法,用于处理同步传感器网络的数据,该同步传感器网络包含多个传感器节点,包括:步骤A:对同步传感器网络中各个传感器节点内的数据进行正规化;步骤B:基于分布式k++算法确定该同步传感器网络的初始聚类中心;步骤C:计算各个聚类中心与传感器节点所存储的数据之间的隶属度值;步骤D:在整个同步传感器网络中执行平均一致性算法更新聚类中心;步骤E:重复步骤C和步骤D直至聚类中心的值收敛。本公开提供的分布式模糊c均值数据聚类方法可以使得由各个传感器节点获得的数据直接应用在传感器层面进行数据分割,有助于减少通讯消耗,是一种十分高效的做法。
技术领域
本公开涉及分布式网络数据挖掘技术领域,尤其涉及一种分布式模糊c均值数据聚类方法。
背景技术
无线传感器网络(WSN)是由大量廉价微型传感器所组成的分布式网络,其由于低成本、低功耗而被广泛应用于军事、航空、环境、生态、农业、工业等领域的监测。单个传感器一般存储小,带宽低,电池容量限制,可以探测震动、温度、湿度、光强、压强等物理量。例如,在野外地区或者不宜人工监测的区域布置WSN可以进行长期无人值守的不间断监测,为生态环境的保护和研究提供实时的数据资料。具体的应用包括:通过跟踪珍稀鸟类等动物的栖息、觅食习惯进行濒危种群的研究。在类似的检测中往往需要获取图像、声音等信息。当获取足够数量的数据后,需要对数据进行挖掘,找出需要的信息。
数据聚类是数据挖掘的核心步骤,它有助于我们了解数据的内在结构及分布模式。数据聚类即把数据对象集合划分成多个不同的类或簇,每个簇内的数据对象之间的相似性要高于与其他簇内的对象的相似性,在各个领域都有着大量应用。
然而,在实现本公开的过程中,本申请发明人发现,传统的聚类算法是集中式的,要求所有数据存储于同一个节点,由一个计算节点集中进行处理。在分布式网络的环境下,由于采集的数据分布存储于各个节点,聚类时需要传输所有数据到一个中心站点进行处理,这样做通讯消耗大且会有存储容量限制。
公开内容
(一)要解决的技术问题
基于上述技术问题,本公开提供一种分布式模糊c均值数据聚类方法,以缓解传统的聚类算法需要将所有数据存储于同一个节点,集中进行处理,导致通讯消耗大且会有存储容量限制的技术问题。
(二)技术方案
本公开提供一种分布式模糊c均值数据聚类方法,用于处理同步传感器网络的数据,该同步传感器网络包含多个传感器节点,包括:
步骤A:对同步传感器网络中各个传感器节点内的数据进行正规化;
步骤B:基于分布式k++算法确定该同步传感器网络的初始聚类中心;
步骤C:计算各个聚类中心与传感器节点所存储的数据之间的隶属度值;
步骤D:在整个同步传感器网络中执行平均一致性算法更新聚类中心;
步骤E:重复步骤C和步骤D直至聚类中心的值收敛。
在本公开的一些实施例中,在执行所述步骤A前,若同步传感器网络的拓补结构是有向图,且权值不平衡,则执行镜像不平衡修正算法修正边的权值使图平衡。
在本公开的一些实施例中,所述步骤A中,将传感器节点中数据各个维度的值放缩到[0,1]之间。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学技术大学,未经中国科学技术大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811397114.9/2.html,转载请声明来源钻瓜专利网。