[发明专利]基于双向长短时记忆单元和胶囊网络的故障分类方法有效
| 申请号: | 201911300214.X | 申请日: | 2019-12-16 |
| 公开(公告)号: | CN111046961B | 公开(公告)日: | 2022-10-04 |
| 发明(设计)人: | 葛志强;廖思奋 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 邱启旺 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 双向 短时记忆 单元 胶囊 网络 故障 分类 方法 | ||
1.一种基于双向长短时记忆单元和胶囊网络的故障分类方法,其特征在于,包括如下步骤:
(1)获取历史工业连续过程的样本x及其标签y组成的数据集D={X,Y}={(xt,yt)|t=1,2,...,N},其中X,Y分别代表所有样本组成的样本集和相应的样本标签集,yt∈{1,2,...,C},t代表样本在时间维度的顺序,N表示数据集的样本个数,C为样本类别数;
(2)将步骤(1)中收集到的数据集标准化,将样本X每个变量x化成均值为0,方差为1,得到新的标准化样本集Xstd,通过one-hot编码将标签集Y元素从标量转化为一维向量,然后,用大小为k的时间窗对样本集Xstd和标签集Y同时进行序列化,从而得到新的序列数据集其中,
(3)构建BiLSTM-CapsNet模型:构建一个第一部分由隐层节点分别为k的前向、后向长短时记忆单元组成的双向长短时记忆单元(BiLSTM),第二部分为胶囊网络(CapsNet),第三部分为单隐层的感知器(MLP),第四部分为Dropout层,第五部分是Softmax输出层的BiLSTM-CapsNet模型;其中,BiLSTM中前向LSTM和后向LSTM的隐层向量拼接成一个长向量作为CapsNet的输入,CapsNet的输出向量经过Flatten操作变成一维长向量作为MLP的输入,MLP输出作为Dropout层输入,Dropout的输出作为Softmax网络层的输入;
(4)将步骤(2)中得到的数据集Dstd_seq作为输入,对步骤(3)构建的BiLSTM-CapsNet进行有监督训练,L个序列样本作为一个批次并进行前向传播,在Softmax层获得网络对真实标签为的输入序列样本的估计值使用交叉熵作为损失函数:
然后,获得的损失通过反向传播算法(BP)调整网络权重及偏置,经过多次迭代得到整个网络参数较优的BiLSTM-CapsNet模型;
(5)获取新的未知故障类别的工业连续过程数据,使用步骤(2)标准化方法和序列化方法处理数据,得到待测序列数据集dstd_seq;
(6)将待测序列数据集dstd_seq输入到步骤(4)训练好的BiLSTM-CapsNet模型中,在Softmax输出层得到该序列样本属于每个故障类别的后验概率,并把后验概率最大的类别作为该序列样本的标签,完成对于该序列样本的故障分类。
2.根据权利要求1所述的基于双向长短时记忆单元和胶囊网络的故障分类方法,其特征在于,所述步骤(3)中,BiLSTM用于提取动态特征,前向LSTM顺序读取序列数据,后向LSTM反向读取序列数据,分别提取动态特征:
前向LSTM提取动态特征:
后向LSTM提取动态特征:
BiLSTM前向、后向隐层特征拼接,作为CapsNet的输入:
其中,是BiLSTM前向LSTM的隐层向量,是BiLSTM后向LSTM的隐层向量,u是CapsNet输入向量,t代表样本或者特征在时间维度的顺序。
3.根据权利要求2所述的基于双向长短时记忆单元和胶囊网络的故障分类方法,其特征在于,所述步骤(3)中,CapsNet用于对动态特征聚类:
CapsNet对输入向量进行聚类
其中,Wtn是一个随机初始化的权重矩阵,vn是CapsNet的输出向量,Zt是归一化因子,n是向量的索引;
squash压缩函数定义为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911300214.X/1.html,转载请声明来源钻瓜专利网。





