[发明专利]一种基于Spark Streaming的流式大规模电力数据分析方法在审

专利信息
申请号: 201910337786.9 申请日: 2019-04-25
公开(公告)号: CN110047016A 公开(公告)日: 2019-07-23
发明(设计)人: 黄建平;钱仲文;张旭东;夏洪涛;王文;杨少杰;王政;陈浩;张建松;沈思琪;正卓凡;毛宾一;吴敏彦;王亿;陈显辉;黄杰;王炎;陈耀军;沈峰;周明磊;纪德良 申请(专利权)人: 国网浙江省电力有限公司;浙江华云信息科技有限公司
主分类号: G06Q50/06 分类号: G06Q50/06;G06F16/245;G06K9/62
代理公司: 北京科亿知识产权代理事务所(普通合伙) 11350 代理人: 汤东凤
地址: 310007*** 国省代码: 浙江;33
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 聚类 电力数据分析 数据流 电力数据 聚类中心 流式 相似性搜索 实验评估 真实数据 传统的 数据集 有效地 离线 并行 测试 改进 发现
【说明书】:

发明公开了一种基于Spark Streaming的流式大规模电力数据分析方法,步骤如下:第一步,利用SS树进行在线电力数据流的相似性搜索,以对电力数据进行聚类;第二步,改进的Spark并行K均值聚类法对离线电力数据流进行聚类,K均值聚类的聚类中心和类数初始值采用第一步所获得的聚类中心。本发明方法在UCI数据集上的实验评估表明,本发明方法优于传统的K均值聚类算法。同时,通过对用户真实数据集的测试发现,本发明可以快速有效地对用户的电力数据进行聚类。

技术领域

本发明涉及一种电力数据分析方法,特别是涉及一种基于Spark Streaming的流式大规模电力数据分析方法。

背景技术

近年来,世界各国人民对保护环境、实现可持续发展的要求越来越高。在此背景下,如何使电力消费行为智能化已成为一个非常重要的研究课题。大量的基本用电量数据已经积累起来。这些数据量大,频率高。同时,用户的电力数据不断生成。新生成的电力数据能更好地反映用户的电力特性。用户电力数据的分布式集群可以为不同的用户提供不同的激励。这样可以帮助电网公司了解用户的消费习惯,为用户提供个性化、差异化的服务。此外,它还帮助企业进一步扩展其服务的深度和重要性,并为制定未来电力需求响应政策提供数据支持。同时,公司将及时向用户反馈居民用电数据和居民用电情况,让用户了解自己的用电信息,为低碳环保做出贡献。所以需要对海量电力数据进行分析。

目前大规模电力数据分析的研究繁多,但大多数分析工作都选用了hadoop大数据平台,并且只针对离线的历史数据进行分析,但是事实上数据是不断产生的,能合理的兼顾离线数据与在线流式数据处理才是重要的。另外,尽管已经有针对K-means算法做了部分优化,但是单纯的优化算法意义并不是很大,一定要结合具体的平台工具进行优化才能更好的发挥算法的作用。

电力用户分类是实现电力资源优化配置的重要手段之一。通过对用户需求、行为和习惯的分析,国家和企业可以为不同的用户提供不同的激励。这样,人们就更愿意使用绿色、清洁的电力资源。在用户聚类分析中,需要对海量高速数据进行实时处理。

目前存在许多种流聚类方法。Birch算法是T.Zhang等人于1996年提出的一种分层聚类算法。C.C.Aggarwal等人在2003年提出了clusstream,一个经典的两层数据流处理框架。T RaKthanmanon等人在2007年提出了E-stream聚类算法,以改善clusstream算法在高比特数据上的低聚类性能。一、阿塞特等在2011年提出了clustere算法,有效地对任意形状分布的数据点进行聚类。R.Marcel等人在2012年提出了streamKm++算法。

目前已有大量的聚类算法和数据流聚类算法,如K-means算法、基于K-means的改进版本算法、clusstream、streamKm++算法等,但这些算法不能直接有效地应用于分布式存储和计算环境。如何将这些算法集成到当前主流的大数据处理框架中,如Hadoop和SparK,是一个非常有价值的问题。而且,,目前在数据流和分布式计算方面的研究成果很少,尚处于探索的初始阶段。

发明内容

本发明的主要目的是提供一种基于Spark Streaming的流式大规模电力数据分析方法,本发明对clusstream算法和K均值算法进行了改进,并将改进后的算法引入到流式大规模电力数据分析中,实现了电力数据的高效聚类。

本发明提供的一种基于Spark Streaming的流式大规模电力数据分析方法,包括:

第一步,利用SS树进行在线电力数据流的相似性搜索,以对电力数据进行聚类;

本步骤具体为:

S101;初始化树结构,并对接收到的电力数据进行聚类,生成多个微聚类;

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网浙江省电力有限公司;浙江华云信息科技有限公司,未经国网浙江省电力有限公司;浙江华云信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201910337786.9/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top