[发明专利]基于自然语言处理和随机森林的特钢生产锭型预测方法在审
申请号: | 202110693719.8 | 申请日: | 2021-06-22 |
公开(公告)号: | CN113780618A | 公开(公告)日: | 2021-12-10 |
发明(设计)人: | 陈金香;王高迈;范子铭;李灿 | 申请(专利权)人: | 冶金自动化研究设计院 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F40/242;G06F40/289;G06K9/62 |
代理公司: | 北京华谊知识产权代理有限公司 11207 | 代理人: | 刘月娥 |
地址: | 100071 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 自然语言 处理 随机 森林 生产 预测 方法 | ||
一种基于自然语言处理和随机森林的特钢生产锭型预测方法,属于特钢生产一体化排产与报料技术领域。通过分析钢铁企业客户订单,提取有关锭型预测的关键特征,以锭型为预测目标变量,构建含有多个客户订单的大数据集。采用自然语言处理方法,将每个样本订单中特征属性中的文字或特殊符号转化为数字属性,并采用随机森林预测模型进行锭型预测,从而实现根据订单中的钢种、尺寸和工艺要求等信息,匹配出客户订单相对应的锭型类别与型号。优点在于,解决了因订单数据集样本特征中存在文本和数值混合问题而引发的锭型分类预测难题。
技术领域
本发明属于特钢生产一体化排产与报料技术领域,具体涉及一种基于自然语言处理和随机森林的特钢生产锭型预测方法。
背景技术
特钢生产具有鲜明的多品种、小批量、工序多样、工艺复杂的特征,其客户订单常常表现为多种多样,涵盖了大量工艺复杂、品种繁多的钢种,而且数量庞大,一些小钢厂的月均订单量也可达到两千多单。多数特钢生产工序可分为炼、锻和热轧三个工序。一体化生产计划与报料是实现根据客户订单精准生产的前提。钢锭,至今仍是热轧工序原料的不二之选,当一个钢厂接到订单时,需要分析其中的信息,明确客户的要求和用途,结合自身生产的设备能力,才能确定该订单从钢水浇铸成钢锭的方式和型号,从而为炼钢部门下达生产指令,生产出合适的钢锭。锭型种类、状况以及其重量大小的正确选择,对制定热轧生产计划起着至关重要的作用。
目前特钢生产现场普遍采用人工做生产计划的方式,从订单所需的产品到对其匹配相应的锻坯和钢钉,往往采用轧、锻和炼三工序计划员和坯料库管理员以及生产人员协同,根据工艺路径和订单产品需求,反复协调,需要3-5天的时间才能匹配好坯料与锭型,完成生产计划与报料工作,费时费力,效率低下,还易出错。随着钢铁行业智能化和信息化的发展,开发出能够自动分类订单、匹配锭型的模型是解决上述问题的关键。然而,高速工具钢生产工艺复杂,钢种繁多,根据客户订单中的产品匹配相对应的钢锭是个难题,属于数据挖掘、人工智能、生产管理、生产工艺等的多学科的交叉领域。因常规机器学习预测模型无法处理文字类的属性特征,因此,本发明提出了基于自然语言处理和随机森林的锭型预测方法,并以某钢厂的实际生产订单验证了方法的有效性。
发明内容
本发明的目的在于提供一种基于自然语言处理和随机森林的特钢生产锭型预测方法。解决了因订单数据集样本特征中存在文本和数值混合问题而引发的锭型分类预测难题。
本发明通过分析钢铁企业客户订单,提取有关锭型预测的关键特征,以锭型为预测目标变量,构建含有多个客户订单的大数据集。采用自然语言处理方法,将每个样本订单中特征属性中的文字或特殊符号转化为数字属性,并采用随机森林预测模型进行锭型预测,从而实现根据订单中的钢种、尺寸和工艺要求等信息,匹配出客户订单相对应的锭型类别与型号。具体步骤如下:
步骤1:数据预处理;
(1)采集3000~5000条数量的客户订单,提取与锭型预测相关的特征,根据工艺规则对每个订单配置相应的锭型类别与型号,并将其作为目标变量;对数据进行清洗,删除错值坏值,修改错误格式,补充缺失值;
(2)分析样本数据的分布情况,通过手动匹配的模式,尽量使各类别的样本数量趋于均衡,从而构建出具有均衡样本量的大数据集。
步骤2:对每个样本的目标变量进行编码,即对每条订单的锭型类别进行编码。因锭型类别有七种,属于多分类问题,故采用标签编码方式,将其数值化,即采用7种不同数值描述7中锭型。
步骤3:自然语言处理
针对特钢订单中的特征存在离散类别型、连续数值型和中文文本型三种形式的问题,采用自然语言处理方法,即不同的编码方法,将其转化为数字格式:
(1)采用N维稀疏向量表示数据集中的离散类别型特征,如钢种, N表示统计类别总数,第N维维度上数值为1,其余N-1维上数值用0表示;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于冶金自动化研究设计院,未经冶金自动化研究设计院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110693719.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理