[发明专利]一种时空注意力网络的非线性动态工业过程产品预测方法有效
申请号: | 201910910902.1 | 申请日: | 2019-09-25 |
公开(公告)号: | CN110705692B | 公开(公告)日: | 2022-06-24 |
发明(设计)人: | 袁小锋;李林;王雅琳;阳春华;桂卫华 | 申请(专利权)人: | 中南大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08;G06Q10/06;G06Q50/04 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 叶碧莲 |
地址: | 410000 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 时空 注意力 网络 非线性 动态 工业 过程 产品 预测 方法 | ||
1.一种基于空间和时间注意力的长短期记忆网络对工业非线性动态过程产品质量预测方法,其特征在于,包括以下步骤:
S1.基于生产过程,通过机理分析和专家知识,选取对质量变量产生影响的若干变量作为输入变量,等时间间隔对所述的输入变量和相应的质量变量连续均匀采样若干次,得到输入变量与相应的质量变量的时间序列原始数据集记为(X,Y);
其中T1为采集样本次数,1≤t≤T1;
S2.对采样的原始数据集进行离差标准化:
对步骤S1所述的数据进行离差标准化:
其中xmin为样本数据的最小值,xmax为样本数据的最大值;
则得到新的数据集记为作为训练集:
其中,n为输入变量的数量,
S3.构建和训练模型
S31.对输入样本进行编码:
利用空间注意力机制对训练集中每个样本计算输入变量和质量变量之间的相关性,并为每个输入变量分配相应的注意力权值,得到新的加权输入样本;利用长短期记忆网络对输入样本提取隐层的特征;
S32.对隐藏层的状态进行解码:
利用时间注意力机制通过计算各个时刻隐藏层状态和当前输出之间的相关性,为各个时刻的隐含状态分配不同的注意力权重并计算加权和作为当前质量变量的预测输入,最后通过一个非线性长短期记忆网络单元得到当前时刻的质量变量的预测值;
S33.确定网络的参数和超参数,训练基于空间和时间注意力的长短期记忆网络:
计算模型的损失函数MSE:
利用误差反向传播算法和Adam算法更新网络参数,在达到最大迭代次数R后停止模型的训练;
S4.实时采集输入变量值,利用训练完成的模型,计算质量变量的预测值:
其中,是解码过程的长短期记忆网络的t-1时刻的隐层输出;c(t)是时间注意力机制的输出;fl(*)表示一个长短期记忆单元;V和bv为网络学习到的权值和偏置。
2.根据权利要求1所述的基于空间和时间注意力的长短期记忆网络对工业非线性动态过程产品质量预测的方法,其特征在于:所述的步骤S31具体处理如下:
利用空间注意力机制对新的数据集中每个样本计算输入变量和质量变量之间的相关性:
其中s(t-1)为解码输出的隐状态,V1i,W1i,U1i为注意力网络权重矩阵,为偏置向量;
对计算出的变量注意力值进行归一化:
得到空间注意力机制的最终输出为:
利用长短期神经网络单元通过前向传播算法得到隐层状态:
遗忘门:
输入门:
输出门:
中间状态输入:
其中w*x,w*h分别表示当前时刻输入前一时刻的隐状态h(t-1)与长短期记忆细胞单元中三个控制门以及中间状态的转换矩阵,b*表示三个控制门和中间状态的偏置量;
当前时刻的细胞状态和隐藏层输出分别为:
h(t)=o(t)⊙tanh(m(t))。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910910902.1/1.html,转载请声明来源钻瓜专利网。