[发明专利]一种基于近邻样本对构造的智能电表故障分类方法在审
申请号: | 202210363323.1 | 申请日: | 2022-04-07 |
公开(公告)号: | CN114722940A | 公开(公告)日: | 2022-07-08 |
发明(设计)人: | 高欣;贾欣;薛冰;黄子健;傅世元;孟之航;黄旭;张光耀 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 近邻 样本 构造 智能 电表 故障 分类 方法 | ||
1.一种基于近邻样本对构造的智能电表故障分类方法,其特征在于,包括如下步骤:
(1)将智能电表不同类别下的故障历史数据作为输入数据集,划分得到多个二类数据集,具体为:
将智能电表实际故障数据集输入,该数据集中的样本共包含工作时长、到货批次号、供电单位编号、电能表类别、故障识别月份、安装月份、省份、设备规格、通讯方式、设备标识9种特征变量;其故障类别标签共包含外观故障、计量故障、存储单元故障、处理单元故障、显示单元故障、控制单元故障、电源单元故障、通讯单元故障、时钟单元故障、其它故障、软件故障11类;遍历故障数据集中的每一类样本,将该类别下所有样本作为少数类样本集,其余类别所有样本为多数类样本集,将原数据集转化为11个二类数据集;对于其中每个二类数据集,均可将数据集描述为:
X=[Xmin,Xmaj]
其中,X为二类数据集,定义xi为X数据集中的任一样本,即xi∈X;Xmin为少数类样本集,定义xmin,i为Xmin数据集中的任一样本,即xmin,i∈Xmin;Xmaj为多数类样本集,定义xmaj,i为Xmaj数据集中的任一样本,即xmaj,i∈Xmaj;
(2)针对每个二类数据集,将每个样本作为目标样本,从其近邻样本池中进行多次随机采样,获得等量的多个同类和异类对照样本组,分别与目标样本组合后得到多个近邻样本对,作为后续分类任务中的正样本或负样本,具体为:
基于步骤(1)中得到的不平衡二分类数据集X=[Xmin,Xmaj],构建平衡的近邻样本对数据集:
对于训练集中的任一样本xi,当其作为目标样本时,可构造多组近邻样本对,具体为:分别使用KNN算法寻找目标样本xi在Xmaj和Xmin中的n个近邻样本,得到xi的多数类近邻样本池和少数类近邻样本池;在备选的多数类近邻样本池中随机采样m个样本作为多数类对照样本组cmaj(xi),与该目标样本组合得到近邻样本对pi,maj,k=(xi,cmaj(xi));在备选的少数类近邻样本池中随机采样m个样本作为少数类对照样本组cmin(xi),与目标样本组合得到近邻样本对pi,min,k=(xi,cmin(xi));
其中,n是近邻样本池的大小,m是对照样本组中样本的数目,k∈[1,K]是对比样本组的标号,K是超参数,为预设定的对于每个样本在每种类别下的构造样本数目,且表示从n个样本中采样m个样本的有序排列数;下标min和maj分别表示少数类和多数类,即:cmin(xi)表示xi的少数类对照样本组,cmaj(xi)表示xi的多数类对照样本组,pi,min,k表示样本xi的第k个少数类对照样本组,pi,maj,k表示样本xi的第k个多数类对照样本组;
当目标样本与对照样本组为同类样本时,称该近邻样本对为正样本对,标签设置为1,反之为负样本对,标签为0,具体为:(xmaj,i,cmaj(xmaj,i))与(xmin,i,cmin(xmin,i))的标签为1;(xmaj,i,cmin(xmaj,i))与(xmin,i,cmaj(xmin,i))的标签为0;对于任意类别的目标样本,均可得到等量的多个正样本对和负样本对,因此,遍历整个X中的样本,分别将构造的近邻样本对及其标签存入集合P与YP中,即可得到平衡的近邻样本对数据集D=(P,YP),并将D中的正样本对和负样本对分别作为后续分类任务中的正样本或负样本;
其中,P为构造得到的近邻样本对集合,YP为P的正确标签;
(3)基于平衡的近邻样本对数据集,构建基于对比学习的模式判别网络用于目标样本与对照样本组的标签匹配任务,具体为:
基于步骤(2)得到的平衡的样本对数据集,构建模式判别网络model并训练,其优化目标为:
其中,Lmodel为模型的损失,且(p,yp)∈(P,YP)为近邻样本对数据集中的训练样本,p为构造得到的近邻样本对,yp为p的正确标签,为模型对p 的预测标签;
(4)对于给定测试样本,任意组合与其对应的不同类别的对照样本组得到大量近邻样本对,经结果集成和逆向推理得到分类器在每个二类数据集下的判别结果,通过软投票得到其故障类别,具体为:
基于步骤(3)中训练得到的模式判别分类器model,对于一个待测样本xtest,其预测标签的计算过程如下:
其中,ptest,maj,k是xtest的一组多数类对照样本对,ptest,min,k是xtest的一组少数类对照样本对,为xtest在该二类数据集下的预测结果;
重复上述过程可得到11个模式判别分类器modelj,j是模式判别分类器的下标,j∈[1,11];对于待测样本xtest,其预测标签的计算如下:
取值为j时,表示xtest的预测故障类别为第j类故障。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210363323.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种基于虚拟现实的交互式训练系统及方法
- 下一篇:用于下背疼痛的抗生素制剂