[发明专利]一种集群数据分析方法及装置有效
申请号: | 201710541642.6 | 申请日: | 2017-07-05 |
公开(公告)号: | CN107341239B | 公开(公告)日: | 2020-08-07 |
发明(设计)人: | 程良伦;傅应龙;王卓薇 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06F16/22 | 分类号: | G06F16/22;G06F16/23;G06F16/28 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 罗满 |
地址: | 510062 广东省*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 集群 数据 分析 方法 装置 | ||
本申请公开了集群数据分析方法及装置,包括,选取预定时间段内的相隔预定时间间隔的时间点对应的移动集群对象数据;建立异常数据动态表;将每个时间点的移动集群对象数据和异常数据动态表内的异常数据点进行分类,得到初始分类结果,将未分类的移动集群对象数据作为异常数据点并存储至异常数据动态表中;从第一个时间点开始,分析每个时间点的初始分类结果和时间点的前一个时间点的初始分类结果的变化,并根据变化的情况对每个时间的初始分类结果进行变化情况标识,得到分类结果。通过建立可以保存未分类数据的异常数据动态表,存储异常数据,避免了有用数据的丢失,同时在分类中也包含该异常数据,可以使数据分析的过程准确度更高。
技术领域
本申请涉及大数据移动数据分析领域,特别涉及一种集群数据分析方法及装置。
背景技术
随着大数据技术的广泛普及,大数据的应用在日常生活中十分常见,尤其在数据厂商根据大数据的分析将广告、消息推送等针对性较强的内容有目的地推送给最适合的对象,这也是大数据的重要应用之一。同时,移动数据的增多,也就是包含对象的运动知识和位置信息的数据增多,可以更加有目的对对象销售产品。利用移动数据,还可以研究交通拥堵预测和动物迁徙。但是,在利用移动数据对移动对像的模式挖掘中,由于对象数据包含的类型多样性,且对数据分析的实时性要求较高,因此为挖掘移动数据的模式带来了挑战。
通常挖掘移动数据的模式应用在例如,交通管理,物流配送和人群检测。这些需要分析集群的变化情况。而对于集群变化的本质:一个集群是否对应于一组汽车简单地消失或者集群中的成员迁移到其他集群中,新出现的集群是否反映新的车辆或者是出现新的目标群体,或者是现有客户的喜好转变而产生的。
因此,研究集群变化情况是分析一段时间内的集群数据变化情况,首先将原始的数据划分为类,才可以以集群为单位研究,再通过不同时间点的集群的区别判断其变化。上述也是目前一般的集群数据的分析方法。
但是,目前的分析方法在较小数量的数据中应用时,得出的结果与现实情况的误差是较小的,当数据量增多时上述方法的模式分析的结果与现实偏差较大,不符合预期结果。
因此,如何解决集群数据分析方法误差较大的问题,是本领域技术人员所关注的热点问题。
发明内容
本申请的目的是提供一种集群数据分析方法及装置,通过在传统的分析方法中建立存放异常数据的表,再在分类时也将表中的数据进行分类,以避免丢失具有分析价值的数据,防止分析过程误差较大,出现不符合预期结果的情况。
为解决上述技术问题,本申请提供一种集群数据分析方法,包括:
选取预定时间段内的相隔预定时间间隔的时间点对应的移动集群对象数据;
建立异常数据动态表;
将每个所述时间点的所述移动集群对象数据和所述异常数据动态表内的异常数据点进行分类,得到初始分类结果,将未分类的所述移动集群对象数据作为所述异常数据点并存储至异常数据动态表中;
从第一个所述时间点开始,分析每个所述时间点的所述初始分类结果和所述时间点的前一个所述时间点的所述初始分类结果的变化,并根据所述变化的情况对每个所述时间的初始分类结果进行变化情况标识,得到分类结果。
可选的,还包括:
根据所述分类结果确定每个所述时间点的类与类之间的关系,构建移动集群模式树;
根据所述移动集群模式树,确定相关移动集群频繁信息。
可选的,所述变化情况的标识,具体包括:
保留、合并、分离、扩张、收缩、消失、出现。
可选的,所述建立异常数据动态表,包括:
建立所述异常数据动态表;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710541642.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及系统
- 下一篇:一种应对倾斜数据流在线连接的处理方法
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置