[发明专利]一种基于LOF算法与混合采样的变压器故障诊断方法在审
申请号: | 202210064482.1 | 申请日: | 2022-01-20 |
公开(公告)号: | CN114528921A | 公开(公告)日: | 2022-05-24 |
发明(设计)人: | 刘超;沈悦 | 申请(专利权)人: | 江苏大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G01R31/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 212013 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lof 算法 混合 采样 变压器 故障诊断 方法 | ||
1.一种基于LOF算法与混合采样的变压器故障诊断方法,其特征在于,包括如下步骤:
S1、收集数据样本;收集油中溶解气体中的故障数据D1,D2,T1,T2和正常数据NC,得到初始的非平衡数据集;
S2、数据预处理;
S3、采用LOF算法分别去除故障数据和正常数据样本集中的异常值;
S4、扩充少数类故障样本数据;
S5、提取多数类正常样本数据;
S6、训练模型;将二次采样过后的正常样本和故障样本整合,得到新的平衡样本集,将新的平衡样本集输入随机森林模型中训练,建立故障诊断模型,
S7、对变压器的故障类型进行分类。
2.根据权利要求1所述的一种基于LOF(Local Outlier Factor)算法与混合采样的变压器故障诊断方法,其特征在于,所述S2中预处理包括对非平衡数据集进行归一化处理,以此缩小数据集的数值范围,归一化方法如下:
将初始数据集带入归一化公式计算,公式如下:
式中zij表示原始数据,代表经归一化处理后的数据;i表示样本数据个数编号;j表示特征维度序号,1~5分别表示五种气体类型数据。
3.根据权利要求1所述的一种基于LOF算法与混合采样的变压器故障诊断方法,其特征在于,所述S3的过程包括:
S3.1计算样本点间距:对于n个待测样本,采用马氏距离来计算任意两个样本点之间的距离,马氏距离公式如下:
计算待测样本点O与其第k个局部集群点的可达距离,公式如下:
distk(O,P)=MAX{distk(O),dist(O,P)}
等式右边表示结果取该点与点O的距离和第k个集群点P与点O距离的最大值;
S3.2计算待测样本点O的局部可达密度lrd(O):
式中Nk(O)表示点O的第k距离领域,即点O的第k距离及以内的所有点,包括第k距离,|Nk(O)|表示为点O的第k个领域点的个数,dk(O,P)表示待测样本点O和第k个集群点P的距离;
S3.3计算局部离群因子LOF,LOF的值反应了某一点的可达密度与其他领域点密度之间的差异,用来作为判断待测点O是否为异常值的依据:
4.根据权利要求3所述的一种基于LOF算法与混合采样的变压器故障诊断方法,其特征在于,公式中lrd(P)和lrd(O)分别表示点P和点O的局部可达密度,若LOF的值越接近1,说明点O的可达密度与其领域点密度相似,若LOF值小于1,说明点O的可达密度高于其领域点密度,若LOF值大于1,则说明点O的可达密度低于其领域点密度,即被认为是异常值。
5.根据权利要求1所述的一种基于LOF算法与混合采样的变压器故障诊断方法,其特征在于,所述S4采用SMOTE算法进行过采样;具体如下:
S4.1设置故障样本数量为T,利用欧式距离计算样本间距,从故障样本中得到k个近邻样本xi(near),near∈{1,...,k}。
S4.2根据不平衡比例设定一个采样倍率N,对于每一个原故障样本xi,在其k个近邻样本中随机挑选一个样本xi(nn),将原故障样本和近邻故障样本按照如下公式合成新故障样本:
xnew=xi+rand(0,1)*|xi-xi(nn)|
S4.3重复上述两步步骤N次,即可合成N个新故障样本xi(new),new∈{1,...,N},此时的样本集即为新故障样本集。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏大学,未经江苏大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210064482.1/1.html,转载请声明来源钻瓜专利网。