[发明专利]一种面向大规模多源异构数据的多聚类方法在审
申请号: | 202310297924.1 | 申请日: | 2023-03-24 |
公开(公告)号: | CN116340437A | 公开(公告)日: | 2023-06-27 |
发明(设计)人: | 张宏俊;李鹏;樊卫北;王汝传;徐鹤;朱枫;程海涛;薛状状;孟凡硕 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/25 |
代理公司: | 南京正联知识产权代理有限公司 32243 | 代理人: | 张玉红 |
地址: | 224000 江苏省盐城市*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 大规模 多源异构 数据 多聚类 方法 | ||
1.一种面向大规模多源异构数据的多聚类方法,其特征在于,包括:
步骤一:在选定时间段内,不间断根据需求接入配电网的不同的业务子系统在线采集目标数据集以形成多源异构数据集;
步骤二:将不同来源的异构数据通过ETL工具进行预处理,使得原始数据的多种格式转换为统一目标数据格式;预处理包括数据筛选、数据修复;
步骤三:对预处理后的多源异构数据集按电压等级、设备类型、采集量测类型进行分类;对分类后的多源异构数据集按照配电网络和网络元件之间的相互关联构建拓扑分析引擎;
步骤四:基于拓扑分析引擎的分析,选择多源异构数据集中满足在相同时间断面,同时电压一致、电流和功率满足KCL定律的数据集,剔除不满足的数据集,得到待融合数据集;其中待融合数据集携带有时间断面;
步骤五:对待融合数据集进行观测系数GF分析,根据观测系数GF分配对应数量的处理终端对待融合数据集进行融合,其中融合基于HFCM聚类算法;
步骤六:输出数据融合结果,供配电网工作人员研究分析,为能源精细化的管理和用户服务提供指导;其中数据融合结果携带有时间断面。
2.根据权利要求1所述的一种面向大规模多源异构数据的多聚类方法,其特征在于,对待融合数据集进行观测系数GF分析,具体分析步骤为:
获取待融合数据集对应的时间断面,调取对应时间断面的研究吸引值YG;
统计待融合数据集的数据大小为D1;获取待融合数据集对应的配电网,调取对应配电网的规模值GM和故障系数GZ;
利用公式GF=YG×g1+D1×g2+GM×g3+GZ×g4计算得到待融合数据集的观测系数GF;其中g1、g2、g3、g4为系数因子。
3.根据权利要求2所述的一种面向大规模多源异构数据的多聚类方法,其特征在于,根据观测系数GF分配对应数量的处理终端对待融合数据集进行融合,具体包括:
数据库内存储有观测系数范围与分配数量阈值的对照关系表;首先确定与观测系数GF对应的观测系数范围,再确定与该观测系数范围对应的分配数量阈值并标记为L1,即分配L1个处理终端对待融合数据集进行融合。
4.根据权利要求2所述的一种面向大规模多源异构数据的多聚类方法,其特征在于,对数据融合结果进行访问监测,并根据访问记录进行研究吸引值YG分析,具体分析步骤为:
在预设时间内,获取数据融合结果的访问记录,所述访问记录包括访问开始时刻和访问结束时刻;获取数据融合结果对应的时间断面;
针对同一时间断面,统计该时间断面的访问次数为C1;将每次访问的访问时长进行累加得到访问总时长ZT;利用公式YG=C1×a1+ZT×a2计算得到该时间断面的研究吸引值YG,其中a1、a2为系数因子。
5.根据权利要求2所述的一种面向大规模多源异构数据的多聚类方法,其特征在于,对配电网进行规模值GM分析,具体为:
获取配电网的供电区域;统计该供电区域内供电线路长度为DL,供电户数为HL以及户均用电量为VL;利用公式GM=DL×a3+HL×a4+VL×a5计算得到配电网的规模值GM,其中a3、a4、a5为系数因子。
6.根据权利要求2所述的一种面向大规模多源异构数据的多聚类方法,其特征在于,对配电网进行检修追踪,并根据检修信息对配电网进行故障系数GZ评估;具体为:
获取配电网在预设时间段内的所有检修信息;所述检修信息包括故障网络元件、检修时长以及检修等级;
统计配电网的检修次数为G1;将每个检修信息中的故障网络元件数标记为GL,检修时长标记为GT,检修等级标记为GD;利用公式JXi=GL×b1+GT×b2+GD×b3计算得到检修值JXi,其中b1、b2、b3为系数因子;
将检修值JXi与检修阈值相比较;统计JXi大于检修阈值的次数为G2,当JXi大于检修阈值时,获取JXi与检修阈值的差值并求和得到超检值CJ;利用公式CP=G2×b4+CJ×b5计算得到超检系数CP,其中b4、b5均为系数因子;利用公式计算得到故障系数GZ,其中f1、f2为系数因子。
7.根据权利要求1所述的一种面向大规模多源异构数据的多聚类方法,其特征在于,步骤三中电压等级分为:35kV,20kV,10kV;设备类型按不同的业务子系统分为:变压器,开关柜,线路;采集量测类型分为:状态量和模拟量、实时数据和非实时数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310297924.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种河道打桩装置
- 下一篇:一种可耐极低负压的浮动衬底电压电路
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置