[发明专利]基于强化学习和知识蒸馏的多类别不平衡故障分类方法有效
申请号: | 202110549644.6 | 申请日: | 2021-05-20 |
公开(公告)号: | CN113222035B | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 张新民;范赛特;魏驰航;宋执环 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 贾玉霞 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 强化 学习 知识 蒸馏 类别 不平衡 故障 分类 方法 | ||
本发明公开了一种基于强化学习和知识蒸馏的多类别不平衡故障分类方法,该方法结合层次聚类、知识蒸馏和强化学习等算法,用来解决多类别不平衡故障分类问题。对于多类别故障分类问题,首先针对不平衡问题中同质类别样本之间存在相似性、异质类样本之间存在较大差异的特点使用层次聚类将多类别聚类为几个簇类,根据不同簇类分别建立学生网络进行细粒度化分类,再用知识蒸馏方法兼顾全局信息,最后结合强化学习迭代学习样本权重,从而提高不平衡故障分类效果。在此过程中,需要设计合理的奖励函数配合细粒度知识蒸馏分类器去优化样本权重。相比其他对比方法,本发明的方法有良好的效果和适用性。
技术领域
本发明属于工业过程监测领域,尤其涉及一种基于强化学习和知识蒸馏的多类别不平衡故障分类方法。
背景技术
在机器学习或深度学习分类中,类别样本数量不平衡是一个非常普遍的问题,广泛存在于各个领域,例如生物信息学,智能电网,医学成像,故障诊断。大多数现有的分类方法都基于以下假设:观测数据的基本分布是相对均衡的。但是,实际工业数据集通常会违反此假设,并呈现出偏斜的分布甚至是极度不平衡的类别样本数量分布。例如,数据驱动的故障分类是工业过程监测的重要组成部分,由于故障发生的频率不同,它们表现出不平衡的偏斜分布。在这种情况下,如果假定所有类别都具有同等的重要性,则分类器会倾向于分对频繁(多数)类别的样本而不是不频繁(少数)类别的样本。因此,迫切需要提出恰当的方法来消除不平衡的类别分布的负面影响,而又不过度牺牲任何多数类别或少数类别的准确性。
发明内容
本发明的目的在于提供一种基于强化学习和知识蒸馏的多类别不平衡故障分类方法,其能对多数类不平衡的分类问题,获得较好的故障分类结果。具体技术方案如下:
一种基于强化学习和知识蒸馏的多类别不平衡故障分类方法,包括以下步骤:
S1:离线建模
S1.1:收集K个类别的历史离线工业过程数据样本,其中包含故障数据和正常数据;
S1.2:计算每个类别特征中心点
S1.3:通过基于Ward-Linkage的层次聚类,将同质类的类别特征中心分配在一个簇类中,最终将所有类别特征中心uk分配到C个簇类中;然后根据类别特征中心的聚类结果分配每个类别的所有样本到对应簇类中;
S1.4:使用高斯伯努利限制玻尔兹曼机,分别基于所有样本以及每个簇类中样本进行训练,其中,所有样本训练得到的高斯伯努利限制玻尔兹曼机参数为教师网络的预训练参数;基于每个簇类中样本训练得到的高斯伯努利限制玻尔兹曼机参数为对应的学生网络的预训练参数;
S1.5:基于所述的教师网络的预训练参数,采用所有样本,通过微调技术,训练多类别不平衡的教师网络,得到的logit作为所有学生网络的软目标;
S1.6:训练完教师网络之后,所有学生网络都通过综合交叉熵损失一起训练;根据包含所述软目标和硬目标的综合损失,采用每个簇类中样本,通过微调技术进行训练,将所有学生网络得到的logit拼接在一起,组成学生网络的综合logit;各个学生网络拼接的每个logit中值的位置对应于原先类别顺序;所述硬目标为样本的真实标签;
S1.7:使用强化学习结合知识蒸馏的输出来学习样本权重,并结合学习后的样本权重、教师网络和各个学生网络的输出构建损失函数;
S1.8:重复S1.5~S1.7,进行强化学习模型和知识蒸馏模型迭代训练,直到模型收敛;
S2:在线应用测试
S2.1:获取在线样本;
S2.2:将在线样本分类到S1.3层次聚类得到的C个簇类的其中一个簇类中;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110549644.6/2.html,转载请声明来源钻瓜专利网。
- 上一篇:复杂软弱围岩浅埋偏压隧道及施工方法
- 下一篇:一种羽毛球架装置