[发明专利]一种基于机器学习的电力用户用电异常检测方法在审
| 申请号: | 202010553003.3 | 申请日: | 2020-06-17 |
| 公开(公告)号: | CN111695639A | 公开(公告)日: | 2020-09-22 |
| 发明(设计)人: | 石东贤;毕晓东;陈启明 | 申请(专利权)人: | 浙江经贸职业技术学院;浙江经济职业技术学院 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q50/06 |
| 代理公司: | 北京中济纬天专利代理有限公司 11429 | 代理人: | 丁燕华 |
| 地址: | 310018 浙江省*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 机器 学习 电力 用户 用电 异常 检测 方法 | ||
1.一种基于机器学习的电力用户用电异常检测方法,其特征在于,具体包括如下步骤:
S1:对电力负荷数据进行清洗,包括数据异常值的处理与数据缺失值的补全,将清洗过的数据集记为X1;
S2:提取电力负荷数据的统计性特征指标、趋势特征指标和频域特征指标;
S3:筛选出分辨率高的特征,将具有该特征的数据组成样本数据集X2;
S4:基于孤立森林算法进行数据筛选,从样本数据集X2中随机抽取n个样本数据放进孤立树的根节点,样本数据的特征维度上产生一个分割点p,将该特征维度里小于p的样本数据放在当前节点的左侧子节点中,将大于等于p的数据放在当前节点的右侧子节点中,在每个子节点中重复分割过程,不断构造新的子节点,直到每个子节点中只有一个数据点,筛选出异常度得分低的数据的前50%作为正常样本,与异常样本组合成数据集X3;
S5:通过基于聚类的分层最近邻欠采样算法,对数据集X3选取最优的聚类簇数,按比例和距离进行采样,获得类间平衡数据集X4;
S6:基于类间平衡数据集X4构建基于半监督学习的协同森林异常检测模型。
2.根据权利要求1所述的基于机器学习的电力用户用电异常检测方法,其特征在于,所述步骤S1中对电力负荷数据进行清洗的具体步骤如下:
S1-1:当时间序列中出现20%以上电力负荷数据为负值,则将该时间序列删除,不作为样本;当时间序列中电力负荷数据少于20%为负值,看作缺失值;
S1-2:将时间序列中缺失量达到50%的电力负荷数据进行删除,对于缺失量低于50%的电力负荷数据,用当日的前一日电表示数和前一日的当日电表示数互相填补,从而将缺失值准确填充,填充的方式如式(1)所示:
其中,df是缺失时间段用电量的均值,datea和dateb分别表示缺失段后端电表示数和前端表示数,numday表示缺失段天数;
S1-3:将经过步骤S1-1和S1-2清洗过的数据集记为X1。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江经贸职业技术学院;浙江经济职业技术学院,未经浙江经贸职业技术学院;浙江经济职业技术学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010553003.3/1.html,转载请声明来源钻瓜专利网。





