[发明专利]一种基于多分类器融合的智能电表故障预测方法有效
申请号: | 202110472639.X | 申请日: | 2021-04-29 |
公开(公告)号: | CN113011530B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 李宁;郭泽林;袁铁江;张伟;齐尚敏;王永超;韩鑫磊;刘海洋;申李;李娜;田娇娟;余英;张皓淼;费守江;周宜 | 申请(专利权)人: | 国网新疆电力有限公司营销服务中心(资金集约中心;计量中心);国网新疆电力有限公司电力科学研究院;大连理工大学 |
主分类号: | G06F18/2411 | 分类号: | G06F18/2411;G06N3/04;G06N3/084;G06Q10/04;G06Q50/06;G06F18/241 |
代理公司: | 北京科迪生专利代理有限责任公司 11251 | 代理人: | 关玲 |
地址: | 830011 新疆维吾尔自治*** | 国省代码: | 新疆;65 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 分类 融合 智能 电表 故障 预测 方法 | ||
1.一种基于多分类器融合的智能电表故障预测方法,其特征在于,所述的方法将从用电信息采集系统中获取的数据进行数据预处理后,依次作为训练样本和测试样本输入到采用融合算法的多分类器模型中进行训练和预测,进而获取数据样本所对应的故障类型,步骤如下:
步骤1:分析智能电表的故障数据信息和故障类型,对从用电信息采集系统中获取的电表故障数据进行缺失值与异常值处理;
步骤2:采用特征选择方法,计算各特征属性与故障类型之间的相关系数,剔除与故障类型相关性小的特征属性,形成特征子集;
步骤3:构建混合采样方法,对少数样本采用过采样、对多数样本采用欠采样的方式,消除数据不平衡特征;
步骤4:将数据集按照8:3比例划分训练组和测试组,分别将训练组和测试组样本输入到支持向量机(SVM)、BP神经网络、随机森林三种分类器中进行训练和测试,统计各个分类器的预测结果,将预测结果以统计概率的形式构建混淆矩阵;
步骤5:结合各分类器对不同故障类型的识别能力,提出权重分配方法并构建评价矩阵,计算得出各分类器对应的权重系数;
步骤6:构建包含各分类器权重系数的决策函数,将经过预处理的训练组和测试组数据输入到各个分类器模型中进行训练和预测,将预测结果相同的分类器的权重相加,取权重和最大的类别作为样本的预测结果;
其中,所述的步骤1中,对电表故障数据进行缺失值与异常值处理方法如下:
针对时间序列X[x1,x2...xn]的缺失数据,采用按照正态分布补全的方法,计算其均值μ和方差σ,生成符合正态分布的数据:
N(μ,σ)表示均值为μ和方差为σ的正态分布,采用箱形图进行异常值的判断,定义如下范围:
[Q1-1.5IQR,Q3+1.5IQR]
IQR=Q3-Q1
其中,Q1、Q3分别表示数据集的第一个四分位数和第三个四分位数,IQR为阈值判断范围,不满足该阈值判断范围的数据均认为是异常值,需要对其进行删除或替换;
所述的步骤2中,所述特征子集形成方法如下:
假定一个故障数据集的形式为D={(x1,y1),(x2,y2)...(xnum,ynum)},其中,xi表示第i个样本的特征属性信息,其维度为N,num=1,2,3,...,num表示故障数据集的样本数量,yi表示第i个样本的故障类型,则第i个样本中,各特征属性与故障类型之间的相关系数可表示为:
ri=[ρ1,ρ2...ρk...ρN]
其中,ρk表示第k个特征属性与故障类型之间的相关系数,ri表示第i个故障类型下的相关系数集,ρk的计算过程如下:
其中,λk表示第k个特征;
通过剔除与故障类型相关性小的特征属性,消除冗余特征和不相关特征,进而形成特征子集;
所述步骤3中,消除不平衡数据的方法如下:
假定数据集中共包含有M种特征属性,统计数据集中各特征属性所对应的样本数量Uj,j=1...M,求取M种特征属性所对应样本数量的平均值Mean_U:
若第j类特征属性所对应的的样本数量小于Mean_U,则采用过采样的方式,否则采用欠采样的方式,采样后样本数量的计算公式如下:
其中,Uj表示采样前的故障数据样本,U′j表示采样后的故障数据样本,Mean_U表示M种特征属性所对应样本数量的平均值;
所述步骤4中,所述混淆矩阵的构建方法如下:
针对支持向量机(SVM)、BP神经网络、随机森林3种分类器,假定智能电表的故障类型有n种,则混淆矩阵的维度为n×n,表示为:
其中,表示第K个分类器正确识别样本故障类型的统计概率,表示第K个分类器错误地将第i类故障识别为第j类故障的统计概率,K的取值为1,2,3;
式中,ml表示第l种故障类型下所包含的样本数量,num_j表示分类器输出的识别结果数量;CMk为第K个分类器的混淆矩阵,第i类故障与第j类故障以及第l种故障为相互独立互不影响的n种故障下的三种;
所述步骤5中,各分类器的权重系数分配方法如下:
构建评价矩阵EMK(n×1)如下:
EMK=CMK·A·M
式中,A为n×n的系数矩阵,其对角元元素均为1,非对角元元素均为-1;M=[m1,m2...ml...mn]T表示故障样本矩阵,ml表示第l种故障类型下所包含的样本数量,n为智能电表的故障类型;
第K个分类器所对应的权重系数λK表示为:
EMK为第K个分类器所对应的评价矩阵,ml表示第l种故障类型下所包含的样本数量;
所述步骤6中,决策函数的构建方法如下:
用XK表示第K个分类器的输出结果,综合考虑各个分类器的权重系数,将分类结果相同的分类器的权重相加,储存在矩阵Bj中:
Bj=λp+λq,Xp=Xq
式中,Xp=Xq表示第p个分类器与第q个分类器的输出结果相同,λp和λq表示第p个分类器与第q个分类器的权重系数,构建决策函数F如下:
F=max(Bj),j=1,2...t
t表示矩阵Bj的个数,取权重和最大的类别作为故障样本的分类结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网新疆电力有限公司营销服务中心(资金集约中心、计量中心);国网新疆电力有限公司电力科学研究院;大连理工大学,未经国网新疆电力有限公司营销服务中心(资金集约中心、计量中心);国网新疆电力有限公司电力科学研究院;大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110472639.X/1.html,转载请声明来源钻瓜专利网。