[发明专利]一种基于孤立森林算法和神经网络的电力运维数据清洗方法有效
申请号: | 201810559071.3 | 申请日: | 2018-06-01 |
公开(公告)号: | CN108776683B | 公开(公告)日: | 2022-01-21 |
发明(设计)人: | 李星南;曾瑛;蔡毅;李伟坚;施展;亢中苗 | 申请(专利权)人: | 广东电网有限责任公司;广东电网有限责任公司电力调度控制中心 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06K9/62;G06N3/08;G06Q50/06 |
代理公司: | 广州粤高专利商标代理有限公司 44102 | 代理人: | 林丽明 |
地址: | 510000 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 孤立 森林 算法 神经网络 电力 数据 清洗 方法 | ||
本发明提供一种电力通信运维数据的清洗方法,更具体地,涉及一种基于孤立森林算法和神经网络的电力运维数据清洗方法,包括:首先利用改进的孤立森林算法,构造解决目标问题的孤立森林模型iForest;然后定义孤立森林算法对异常数据的评价体系;通过训练BP神经网络对通过孤立森林检测出的异常数据属性进行预测修正。本发明针对基于孤立森林算法和神经网络的电力通信运维数据清洗方法进行优化,提高了异常检测精确度并降低数据修正误差,为电力运维数据清洗程序在异常数据定位准确性、数据修正准确率、训练时间和资源占用等方面都得到了有效的优化。
技术领域
本发明提供一种电力通信运维数据的清洗方法,更具体地,涉及一种基于孤立森林算法和神经网络的电力运维数据清洗方法。
背景技术
随着电力通信网的蓬勃发展,电力运维数据体量越来越大,电力部门对数据可靠性的要求也越来越高。在电力运维数据的传输与存储过程中,受外界干扰与传输误差等影响,不可避免会产生噪声、数据缺失、数据错误等不良数据问题;电力数据含有多维属性且分别由不同设备获取,给数据的异常检测提出了挑战。传统的计算均值与回归分析等数据修正方式无法准确地学习整个数据集的特征与规律,特别是当数据维度较高的情况,导致了数据修正误差较大。目前,数据清洗主要包括一致性检验,错误值、缺失值和无效值的处理等机制,可采用人工神经网络算法提高数据质量。专利201610370415.7针对RFID数据公开了一种数据清洗方法,通过硬件EPC(Electronic product code,电子产品码)过滤器来过滤编码错误的数据,从而实现了对重复数据的清洗。但是该方法没有针对缺失值和无效值进行修正,同时由于硬件处理能力受限,不适合处理大规模属性复杂的电力运维数据;专利201510129479.3在数据仓库中基于ETL机制进行数据清洗,清洗范围大,算法执行效率高。但由于电力运维数据含有多维属性,数据体量、规模巨大,属性复杂,上述方案在清洗精度和数据质量等方面仍有不足。选择高效的数据清洗方法为电力运维数据的分析和挖掘提供了重要支撑,对电力运维综合效益的提高具有重要意义。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提供一种基于孤立森林算法和神经网络的电力运维数据清洗方法,本方法改善了孤立森林算法的分支步骤,提高了孤立森林模型的效率和准确性,使学习速率随着网络的变化趋势自适应调整,改善BP神经网络的性能。此方法在异常数据定位准确性、数据修正准确率、训练时间和资源占用等方面都得到了有效的优化。
为解决上述技术问题,本发明的技术方案如下:
一种基于孤立森林算法和神经网络的电力运维数据清洗方法,其特征在于,包括以下步骤:
S1、利用改进的孤立森林算法,构造解决目标问题的孤立森林模型iForest;
S2、定义孤立森林算法对异常数据的评价体系;
S3、训练学习速率自适应BP神经网络对通过孤立森林检测出的异常数据属性进行预测修正。
作为优选,所述步骤S1的具体包括如下:
S11、方法的开始阶段,首先将属性分组;
S12、从训练数据集中随机选择ψ个样本数据点作为子采样集,并构造一棵初始iTree,将子采样集放入树的根节点;ψ为随机选择的样本数据点个数;
S13、随机指定数据项的一个属性组,在当前节点数据中选择划分切割点;
S14、以此切割点生成一个超平面,将当前节点的数据空间划分为两个子空间,并划分数据项;
S15、递归构造新的孩子节点,直到孩子节点中只有一个数据项(无法继续切割)或该iTree已经达到初始定义好的限定高度。
作为优选,所述的步骤S2具体包括:
S21、选定测试数据x,将其代入森林中的每一棵iTree;x表示测试数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司;广东电网有限责任公司电力调度控制中心,未经广东电网有限责任公司;广东电网有限责任公司电力调度控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810559071.3/2.html,转载请声明来源钻瓜专利网。