[发明专利]一种用于构建高炉铁水硅含量预测模型的数据优选方法及系统有效
申请号: | 202010143429.1 | 申请日: | 2020-03-04 |
公开(公告)号: | CN111461171B | 公开(公告)日: | 2023-05-26 |
发明(设计)人: | 尹林子;关羽吟;蒋朝辉;许雪梅 | 申请(专利权)人: | 中南大学 |
主分类号: | G06F18/214 | 分类号: | G06F18/214;G06F18/23213 |
代理公司: | 长沙市融智专利事务所(普通合伙) 43114 | 代理人: | 龚燕妮 |
地址: | 410083 湖南*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 构建 高炉 铁水 含量 预测 模型 数据 优选 方法 系统 | ||
本发明公开了一种用于构建高炉铁水硅含量预测模型的数据优选方法及系统,运用非监督学习算法k‑means++进行聚类,将输入变量样本根据相似程度分簇,从复杂的高炉铁水数据中剔除异常的数据,强化了输入变量样本与硅含量数据之间的映射关系;同时,基于连续时间段指标,筛选高可信度样本,有效降低异常样本对映射关系的干扰;基于频数直方图确定硅含量高频区间,克服了传统均值化方法的保守性,为输入变量样本提供最匹配的硅含量数据。经过评估模型验证,该数据优选方法与传统均值法相比,在模型训练中有更好的表现。本发明解决了原始输入数据与硅含量之间映射关系弱的问题,可有效改善预测模型训练效果。
技术领域
本申请属于高炉铁水硅含量预测领域,特别涉及一种用于构建高炉铁水硅含量预测模型的数据优选方法及系统。
背景技术
铁水硅含量预测是高炉优化控制的关键之一,目前多数研究者采用数据驱动的思想来建立高炉铁水硅含量预测模型,这些模型对训练数据集质量有较高的要求。然而,由于高炉冶炼具有多尺度特征且数据采集环境恶劣,采集的原始数据存在严重的异常、缺失等问题,尤其是原始硅含量数据分布不均衡且噪声严重,导致输入变量与硅含量之间的映射关系弱。具体表现为:输入变量由传感器采集以每小时为间隔记录,而硅含量数据受工艺限制由人工采集化验,在部分输入变量记录间隔内硅含量值较多、波动较大且具有时滞性。此时,难以合理确定与该输入变量最匹配的硅含量值,对获取高质量训练集和构建稳定预测模型造成了极大的阻碍。为了增强输入变量与硅含量之间的映射关系,有学者提出计算一定时间间隔内算术平均值的方法,如宋菁华.高炉冶炼过程的多尺度特性与硅含量预测方法研究[D].浙江大学,2016和Chu Y,Gao C.Data-based multiscale modeling for blastfurnace system[J].AIChE Journal,2014,60(6):2197-2210.公开了一种包样分析法,即出铁过程中依次采集两个硅含量值,取其算术平均值;刘敏,基于模糊模型的高炉硅含量研究及预测[D].内蒙古科技大学,2012则对各输入量以30min为采样间隔时间段对数据进行融合,即计算30min内数据的算术平均值。
然而,我们发现计算算术平均值的方法仅对均匀采样的时间序列数据是有效的,但对于非均匀时间间隔的数据,由于其时间序列的数据量少而效果不佳;当输入变量记录间隔内存在多个硅含量值且波动较大时,均值法较为保守,易受噪声干扰使硅含量偏离正确范围。
发明内容
本发明的目的在于提供一种用于高炉铁水硅含量预测模型的数据优选方法。解决高炉铁水原始数据中存在的记录时间非均匀间隔、数据波动大以及输入变量样本与硅含量数据映射关系弱等问题,建立为输入变量与匹配合理的硅含量之间的合理关联值,从而提高硅含量为基于数据驱动的预测模型的预测效果提供高质量的训练集。
本发明提供的技术方案如下:
一方面,一种用于构建高炉铁水硅含量预测模型的数据优选方法,包括:
获取高炉铁水生产样本数据,包括生产过程输入变量样本和硅含量样本;
利用聚类模型对生产过程输入变量样本进行聚类,并剔除异常输入变量样本;
基于设定的连续时间长度指标,从各簇输入变量样本中提取各簇代表时间段;
绘制各簇代表时间段内包含的硅含量值的频数直方图,并确定各簇硅含量值的高频区间;
基于各簇硅含量值的高频区间,为各簇每个输入变量样本从对应的所有硅含量样本中选取最佳硅含量值。
本方案通过运用聚类方法,将输入变量样本根据相似程度分簇,从复杂的高炉铁水数据中剔除异常的数据;同时,基于连续时间段指标以及频数直方图标示出各簇输入变量对应的合理硅含量范围,以此为依据为输入样本关联最佳硅含量值。解决了原始输入数据与硅含量之间映射关系弱的问题,可有效改善预测模型的效果。
进一步地,为各簇输入变量样本选取最佳硅含量值的具体过程如下:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中南大学,未经中南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010143429.1/2.html,转载请声明来源钻瓜专利网。