[发明专利]一种分层集成的高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法有效
申请号: | 201710598996.4 | 申请日: | 2017-07-21 |
公开(公告)号: | CN107451101B | 公开(公告)日: | 2020-06-09 |
发明(设计)人: | 熊伟丽;赵帅;陈树 | 申请(专利权)人: | 江南大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06K9/62 |
代理公司: | 南京禹为知识产权代理事务所(特殊普通合伙) 32272 | 代理人: | 王晓东 |
地址: | 214122 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种分层集成的高斯过程回归软测量建模对脱丁烷塔底丁烷浓度进行预测的方法,用于复杂多变的多阶段性的化工过程。该方法是一种在线的多模型策略。用高斯混合模型对过程的不同阶段进行辨识,对各阶段的数据进行主成分分析,依据各辅助变量在主元空间上的贡献度,将各模态数据分别划分成若干子空间,建立相应的高斯过程回归软测量模型。当新的数据到来时,采用子空间PCA进行变量选择,根据离线建立的软测量模型,可得到各模型的预测输出。对子空间模型输出进行均值融合,可得到第一层集成输出,即各模态下的局部预测输出,最终根据计算得到的新的数据隶属于每个不同阶段的后验概率,用后验概率对各模态局部预测进行融合,得到第二层集成输出。能够对关键变量进行精确预测,从而提高产品质量,降低生产成本。 | ||
搜索关键词: | 一种 分层 集成 过程 回归 测量 建模 丁烷 浓度 进行 预测 方法 | ||
【主权项】:
一种分层集成的高斯过程回归软测量建模方法,其特征在于,该方法步骤为:步骤1:收集过程输入输出数据,组成历史训练数据库步骤2:基于历史训练数据估计得到高斯混合模型(Gaussian mixture model,GMM)的参数,然后把完整的输入和输出训练数据划分到不同的操作阶段,所述的高斯混合模型算法为:GMM假设数据服从具有未知参数的混合高斯分布。给定训练样本集X∈Rn×m和y∈Rn×1,其中n是样本点个数,m是样本维数。假定训练样本X服从K成分的高斯混合模型,则概率密度可以表示为:其中,m是过程变量的维数,n是训练样本的个数,Θ={π1,…,πK,μ1…μK,Σ1,…,ΣK}是高斯混合模型的参数,其中μk、ΣK和πk分别代表第k个高斯成分的均值、协方差和权值;同时,参数πk满足和0≤πk≤1,式(1)中N(X|Θi)表示多元高斯概率密度函数:通过期望最大化算法(expectation‑maximization,EM)估计模型的参数,对于新来样本xq对于每个高斯成分的后验概率可通过式(3)计算得到;步骤3:根据步骤2辨识得到的不同操作阶段,对应建立不同的子数据库,针对不同的操作阶段数据采用子空间PCA进行分解,子空间PCA算法为:假设有训练样本集D={X,y},其中X={xi∈Rm}i=1,2,...,n是n个训练输入样本,m是辅助变量个数,y={yi∈R}i=1,2,...,n是n个输出样本,PCA模型如式(4)和(5)所示:X=TPT+E (4)T=XP (5)式中,P∈Rm×t和T∈Rn×t分别表示第k个操作阶段下的载荷矩阵和得分矩阵,E∈Rn×m表示残差矩阵,t表示选择的主成分数目。不同主元之间互不相关,根据主元方向构建不同的子模型,增加模型间的差异性,在每个主元方向上,由每个变量的贡献指数(contribution index,CI)来衡量其重要性,贡献指数的定义如式(6)所示:其中i=1,2,...,m,j=1,2,...,t,pij是载荷矩阵对应的第j个主元上的第i个元素。CI的值越大,表示变量包含的信息越多,与主元方向的相关性越强。根据CI的值进行降序排列,设置不同的CI阈值确定各子空间模型选取的辅助变量个数。基于主元方向的不相关性,根据不同主元方向将训练样本集X划分为d个不同的子空间;步骤4:在d个不同主元方向将第k个操作阶段下的样本集Sk划分为d个不同的子空间;步骤5:对不同的子空间建立离线的局部SPCA‑GPR模型;给定数据集{X,y},其中X∈Rn×m,y∈Rn×1,n样本点数,m是样本维数。输入输出之间满足式(8)所示关系:y=f(x)+ε (8)式中ε是均值为0,方差为的高斯噪声,f是未知的函数形式;GPR假设回归函数y=f(x)具有零均值的高斯先验分布,描述如式(9):y~N(0,C) (9)式中C为n×n的协方差矩阵,其i行j列元素定义为Cij=C(xi,xj;θ),协方差矩阵通过核函数计算得到,文中选取平方指数协方差核函数,定义如式(10)所示:式中δij=1仅在i=j时成立,否则δij=0,l为方差尺度,为信号方差,为噪声方差,为GPR的超参数,超参数的选取对模型性能有很大影响,采用最大似然估计法可以获得最优的超参数;对于新来的样本xq,其对应的GPR模型输出均值和方差如式(11)和(12)所示:其中c(xq)=[C(xq,x1),...,C(xq,xn)]是新来样本与训练样本间的协方差矩阵,C是训练样本之间的协方差矩阵,C(xq,xq)是新来样本的自协方差;步骤6:对于新来样本点,根据式(12)所示建立好的离线SPCA‑GPR模型,得到子空间下的预测值,由式(13)得到第一层集成输出;其中是第k个操作阶段第i个子空间模型的预测输出,是第k个操作阶段的局部输出;步骤7:计算新来样本点对于各操作阶段的后验概率,根据式(14)进行融合输出,得到最终的质量预测,完成第二层集成输出:其中的P(Sk|xq)根据式(3)可计算得到:。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江南大学,未经江南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710598996.4/,转载请声明来源钻瓜专利网。