[发明专利]一种基于不完整训练数据集的蒸汽流量区间预测方法有效
申请号: | 201710938943.2 | 申请日: | 2017-10-11 |
公开(公告)号: | CN107704962B | 公开(公告)日: | 2021-03-26 |
发明(设计)人: | 赵珺;陈龙;韩中洋;王伟 | 申请(专利权)人: | 大连理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/04 |
代理公司: | 大连理工大学专利中心 21200 | 代理人: | 温福雪;侯明远 |
地址: | 116024 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于不完整训练数据集的蒸汽流量区间预测方法。针对含缺失点的蒸汽流量时间序列数据,利用相空间重构技术构造输入输出训练样本集,并建立一个初始相关向量机回归模型。然后通过贝叶斯方法推导出缺失输出的后验概率分布;并由缺失输出的后验概率的均值来填补与输出相对应的缺失输入点,不断迭代上述推导与填补过程来训练预测模型。通过单步迭代预测方法来预测未来一段趋势的预测值,其预测区间边界由预测分布的均值和方差决定。这种预测方法可以很好地应用在含有缺失点时间序列数据集中,其预测结果更好地辅助调度人员进行冶金蒸汽能源系统的平衡优化工作。 | ||
搜索关键词: | 一种 基于 完整 训练 数据 蒸汽 流量 区间 预测 方法 | ||
【主权项】:
一种基于不完整时间序列数据集的冶金企业蒸汽流量区间预测方法,其特征在于如下步骤:(1)数据准备与初始填补从工业现场实时关系数据库提取一段时间的冶金企业蒸汽流量时间序列数据,检测并记录时间序列中缺失点的位置,并用零值填补所有缺失点;(2)基于相空间重构的输入输出样本集构建假设有一条含缺失点的离散时间序列{u(1),u(2),...,u(k),...,u(Nu)},其中u(k)表示第k个采样时刻的时间序列值,Nu是序列的总长度;由式(1)构造第i个相矢量si(p):si(p)=[u(i),u(i+τ),u(i+2τ),...,u(i+(p‑1)τ)]T (1)其中,i=1,2,...,N,而N=Nu‑(p‑1)τ/Δt,τ表示延迟时间,Δt表示数据的采样间隔,p是相矢量的嵌入维数,也是矢量si(p)的长度;第i个相矢量si(p)同时表示输入样本集中的第i个输入样本,即xi=si(p),有xi=[xi1,xi2,...,xic,...,xip]T,其中xic是向量xi中的第c个分量,c=1,2,…,p;向量xi对应的目标值ti为式(2)所示:ti=u(i+p×τ) (2)此外,N个输入样本的矩阵形式为X=[x1,x2,...,xi,...,xN]T;N个目标值所组成的向量为t=[t1,t2,...,ti,...,tN]T;对于由含缺失点的时间序列构造的输入输出样本集,事先记录下输入输出中缺失点的对应关系;(3)构建初始相关向量机回归模型假设第i个目标值ti与第i个输入向量xi有如下的映射关系:ti=Σj=0NwjK(xi,xj)+ϵi=φiTw+ϵi---(3)]]>其中,j=0,1,2,…,N,xj是第j个输入向量,且规定K(xi,x0)=1;另外,第i个基函数向量φi表示为φi=[1,K(xi,x1),K(xi,x2),...,K(xi,xj),...,K(xi,xN)]T,w=[w0,w1,...,wj,...,wN]T表示权值向量,K(xi,xj)=exp{‑||xi‑xj||2/2l2}是高斯核函数,其中,l≠0是核函数参数;εi表示第i个均值为0,方差为σ2的高斯分布噪声项,β≡σ‑2;对w中的每一个元素分别附加均值为0而方差不同的正态先验分布:p(w|α)=Πj=0NN(wj|0,αj-1)---(4)]]>其中,参数α=[α0,α1,...,αj,...,αN]T,αj是第j个权值wj的先验方差的倒数,且有对角阵A=diag(α);并且同时将参数α和β视为随机变量,并假设它们服从伽马分布;(4)基于不完整数据集的相关向量机回归模型构建构建最终预测模型就是要通过输入输出样本集来迭代计算如下变量:权值向量w;缺失输出向量t[m],即输出集中所有缺失点组成的向量;缺失输入向量x[m],即输入集中所有缺失点组成的向量;噪声方差参数β的点估计值;具体步骤如下:①初始化:向量α中的元素初始化为值1/N2,β[obs]初始化为10倍的t[obs]的方差,β[obs]是输出集中可观测点的噪声方差的倒数,有β[obs]≡σ‑2;其中,t[obs]表示输出集中所有可观测值组成的向量;相关向量集初始化为所有输入样本的集合,此时相关向量集中有N个样本;②分别使用式(5)和(6)更新w和t[m]的联合后验概率的均值μ[w,m|obs]和协方差矩阵Σ[w,m|obs];μ[w,m|obs]=-Σ[w,m|obs]-Φt[obs]TB[obs]0t[obs]---(5)]]>Σ[w,m|obs]=A+ΦTBΦ-Φt[m]TB[m]-B[m]Φt[m]B[m]-1---(6)]]>其中,β=[β[m],β[m],...,β[m],β[obs],...,β[obs],β[obs]]T,β还可写成写成对角矩阵的形式是Β[m]=diag(β[m]),Β[obs]=diag(β[obs])和Β=diag(β);矩阵Β[m]和Β[obs]大小分别为N[yobs]×N[yobs]和N[m]×N[m],而N[yobs]和N[m]分别表示输出集中可观测点和缺失点的个数,有N=N[yobs]+N[m],将β[m]设置为不小于108的值;另外,Φ表示核函数矩阵,有Φ=[φ1,φ2,...,φi,...,φN]T,并且将Φ表示成分块矩阵的形式为其中和是由缺失输出点和输出可观测点分别在输出样本集中的位置索引所提取的核矩阵Φ中以行为单位的行向量所组成的各自的新矩阵,大小分别为N[m]×(N+1)和N[yobs]×(N+1);③采用(7)和(8)式更新αj和β[obs];αj=γ~jμ~j2---(7)]]>β[obs]-1=||t[obs]-Φt[obs]μ~||2Nyobs-β[obs]Tr(Σ~Φt[obs]TΦt[obs])---(8)]]>其中,且Tr(·)表示矩阵的求迹运算;④如果αj>M,M设置为大于1010的值,将第j个样本从相关向量集中除去;⑤通过(9)式来计算x[m]中每一个元素的后验概率均值,并填补到输入集中输入缺失点的相应位置,并进一步更新核矩阵Φ;μx[m],v=∫t[m],corr_vp(t[m],corr_v|t[obs],α,β[obs])dt[m],corr_v---(9)]]>其中,x[m]集合中共有个输入缺失点,x[m],v表示x[m]中的第v个元素,表示的后验概率均值;而t[m],corr_v表示第v个缺失输入点在缺失输出集t[m]中的对应变量值;t[m],corr_v的后验概率p(t[m],corr_v|t[obs],α,β[obs])由式(5)和(6)得出;⑥由(10)式计算对数边缘似然度函数的值;L~=log(∫p(t[m],t[obs]|w,β[obs])p(w|α)dt[m]dw)=log(N(t[obs]|0,C~))=-12(Nlog(2π)+log|C~|+t[obs]TC~-1t[obs])---(10)]]>其中,协方差矩阵矩阵大小为N[yobs]×N[yobs],I是单位矩阵,log(·)表示自然对数运算;⑦如果α中有元素相对上次迭代的变化或边缘似然度函数值的变化小于给定的阈值,终止迭代过程,得出最终预测模型;否则,转到第②步;(5)单步迭代预测得出未来一段时间的预测区间给定一个新的输入样本x*,此输入向量中没有缺失点,得出对应的输出t*的预测分布近似为一个正态分布p(t*|t[obs])≈∫p(t*|x*,w,β[obs]*)p(w|t[obs],α,β[obs]*)dw=N(t*|μ*,σ*2)---(11)]]>其中,μ[w|obs]是权值向量w的后验概率的均值,由式(8)计算得到;此时,预测上下限分别表示为Ulimit=μ*+z1-χ2×σ*---(12)]]>Llimit=μ*-z1-χ2×σ*---(13)]]>其中,Ulimit和Llimit分别表示置信区间为(1‑χ%)的预测区间上下限,同时是标准高斯分布中对应概率为的分位数;未来一段时间的预测均值由单步迭代的方式给出;每一次预测输出的预测均值是一个点,且下一轮的预测会将上一轮的预测结果作为输入,进行循环滚动预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710938943.2/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置