[发明专利]一种基于选择性双层集成学习适用于复杂工业过程产品质量指标缺失数据补全的方法及系统有效
申请号: | 201810305512.7 | 申请日: | 2018-04-08 |
公开(公告)号: | CN108490782B | 公开(公告)日: | 2019-04-09 |
发明(设计)人: | 袁小锋;吴东哲;王雅琳;李灵;阳春华;桂卫华 | 申请(专利权)人: | 中南大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 叶碧莲 |
地址: | 410000*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及工业过程控制技术领域,公开了一种基于选择性双层集成学习适用于复杂工业过程产品质量指标缺失数据补全的方法及系统。首先提取采样数据的不同维变量生成多个采样集作为子模型的训练集;然后对每个子模型分别采用向量机、BP神经网络、偏最小二乘法三种方法进行建模;最后提出了一种补全效果评估指标,对各子模型的补全效果进行评估,选取补全效果最好的几个子模型进行选择性集成。本发明充分利用了训练样本的全部变量,具有较好的数据补全效果,有助于企业根据分析得到的生产过程实际运行状况进行有针对性的生产操作优化。 | ||
搜索关键词: | 子模型 产品质量指标 复杂工业过程 集成学习 缺失数据 工业过程控制 偏最小二乘法 选择性集成 变量生成 采样数据 生产操作 生产过程 效果评估 训练样本 运行状况 采样集 向量机 训练集 建模 评估 优化 分析 | ||
【主权项】:
1.一种基于选择性双层集成学习适用于复杂工业过程产品质量指标缺失数据补全的方法,其特征在于,包括如下步骤:S1.生成训练集:S11.收集复杂工业过程产品质量指标,形成的具有N个样本的原始数据集;S12.从所述的原始数据集中有放回地随机抽取和原始数据集容量相同的采样集,重复M次,得到M个相互独立的采样集;S13.对每个所述的采样集不放回地随机选取K个变量作为训练集的特征变量,所述的K的值由经验公式确定:
其中P的值为原始数据集的总维数,由此生成M个N×K的训练集;S2.建立子模型并生成补全结果:S21.基于所述M个训练集,对每个训练集分别使用偏最小二乘法、支持向量机、BP神经网络三种建模方法补全数据,分别得到三个补全结果:
S22.使用最小二乘法分别估计偏最小二乘法、支持向量机、BP神经网络三种建模方法的权重z1、z2、z3,加权计算得出每个子模型的补全结果,具体计算如下:假设实际输出为y,则
令z=[z1,z2,z3]T,
则上式可简记为:X·z=y应用最小二乘法可以得到权重z的估计:
那么,第i个子模型的补全结果为
S3.确定最终补全结果:基于所述每个子模型的补全结果,根据提出的补全效果评估指标对所述M个子模型的补全结果进行评估,并依据评估得分进行排序,选择得分高的S个子模型的平均值作为最终的补全结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810305512.7/,转载请声明来源钻瓜专利网。