[发明专利]基于过滤策略的特征对齐自编码器故障分类方法有效
申请号: | 202110575512.0 | 申请日: | 2021-05-26 |
公开(公告)号: | CN113222046B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 张新民;张宏毅 | 申请(专利权)人: | 浙江大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00 |
代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 贾玉霞 |
地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 过滤 策略 特征 对齐 编码器 故障 分类 方法 | ||
1.一种基于过滤策略的特征对齐自编码器故障分类方法,其特征在于,该方法包括以下步骤:
步骤一:收集工业过程的正常工况数据以及各种故障数据,得到建模用的训练数据集:有标签样本集和无标签样本集其中,x代表输入样本,y代表样本标签,m表示有标签样本个数,n表示无标签样本个数;
步骤二:构建用于重构的堆叠自编码器模型,并利用有标签样本集对堆叠自编码器模型进行训练;
步骤三:利用训练好的堆叠自编码器模型对无标签样本集进行过滤,构建特征对齐自编码器分类模型;
所述步骤三具体分为如下的子步骤:
(3.1)基于有标签样本的重构误差El估算χ2分布参数g和h
g·h=mean(El)
2g2·h=variance(El)
(3.2)计算用于过滤异常无标签样本的检测统计量,根据所述的χ2分布参数g和h,通过查χ2分布表查询出对应某一置信度下的重构误差的阈值q;
(3.3)计算无标签样本的重构误差单个样本的重构误差计算公式如下:
其中,表示模型对输入的重构;
(3.4)过滤掉无标签数据集中重构误差大于阈值q的样本,得到过滤后的无标签样本集Suf,r为留下的无标签样本的数量;
(3.5)构建特征对齐自编码器分类模型,采用有标签样本集和过滤后的无标签样本集对所述特征对齐自编码器分类模型进行训练;训练过程分为:无监督预训练和有监督微调;在无监督预训练阶段,采用有标签样本和过滤后的无标签样本一起训练一个堆叠自编码器;所述有监督微调是在无监督预训练获得的堆叠自编码器上增加一层全连接神经网络层并将其作为类别的输出构成,从而得到有标签样本的深层提取特征和类别标签,以及无标签样本的深层提取特征和预测的类别标签输出,具体计算公式如下:
其中,代表第i个有标签样本的深层提取特征,代表预测的第i个有标签样本的类别标签,{wc,bc}表示全连接神经网络层的权重向量和偏差向量;代表无标签样本的深层提取特征,代表预测的类别标签输出;
(3.6)类别数目为F,获得对应于每一类别f∈F的有标签样本和无标签样本的深层提取特征和
(3.7)采用下式计算特征对齐自编码器分类模型的训练损失函数:
其中,crossentropy代表交叉熵损失函数,代表Sinkhorn距离函数,其用于度量属于同一类别的有标签数据特征分布和无标签数据特征分布的距离,α为Sinkhorn距离的权重,为网络参数的L2正则化惩罚项,β是它的权重;
步骤四:采集现场工作数据并输入所述特征对齐自编码器分类模型,输出对应的故障类别。
2.根据权利要求1所述的基于过滤策略的特征对齐自编码器故障分类方法,其特征在于,所述步骤二具体分为如下的子步骤:
(2.1)构建用于重构的堆叠自编码器模型,包含多层编码器和解码器,模型输出是对输入的重构,计算公式如下:
其中,x表示输入,zk代表提取的第k层特征,k表示堆叠自编码器的第k层,和分别表示编码器和解码器的权重向量和偏差向量;
(2.2)采用步骤一构建的有标签样本集,采用随机梯度下降算法对所述堆叠自编码器模型进行训练,其模型训练损失函数定义为对输入的重构误差,重构误差由下式表示:
其中,代表第i个有标签输入样本,代表堆叠自编码器对它的重构;
(2.3)利用训练好的堆叠自编码器模型,计算有标签样本的重构误差其中,单个样本的重构误差参照如下公式计算:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110575512.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种棉质单向导湿面料
- 下一篇:一种高速公路施工养护装置