[发明专利]一种基于回归决策树的光纤生产规则制定方法有效
| 申请号: | 201811542570.8 | 申请日: | 2018-12-17 |
| 公开(公告)号: | CN109559059B | 公开(公告)日: | 2022-12-27 |
| 发明(设计)人: | 王进;邵帅;许景益;孙开伟;邓欣;陈乔松 | 申请(专利权)人: | 重庆邮电大学 |
| 主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/04;G06K9/62 |
| 代理公司: | 重庆市恒信知识产权代理有限公司 50102 | 代理人: | 刘小红;陈栋梁 |
| 地址: | 400065 重*** | 国省代码: | 重庆;50 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 回归 决策树 光纤 生产 规则 制定 方法 | ||
本发明请求保护一种基于回归决策树的光纤生产规则制定方法,属于机器学习、大数据处理技术领域,具体包括步骤:101收集光纤生产过程中的光棒数据和光纤数据并对光棒数据和光纤数据进行预处理操作;102对光棒数据进行特征工程构建操作;103建立决策树回归模型;104通过交叉验证对模型进行调优;105根据决策树分裂的路径获得光纤生产规则。本发明主要是通过对光纤生产过程中的光棒数据和光纤数据进行预处理和分析提取特征,建立决策树回归模型,并对模型进行优化,通过决策树分裂的路径获取光纤生产的规则。
技术领域
本发明属于机器学习、大数据处理技术领域,尤其基于回归决策树的光纤生产规则制定方法。
背景技术
光纤产业是我国国民经济的重要支柱。近些年,随着通信和移动互联网的迅速发展,国内的光纤需求量日益增加,光纤产业在生产能力和技术实力上得到了快速提高,目前正朝着产业信息化,智能化和数据化发展。在光纤生产过程中,光纤生产专家根据光棒的测量参数来判断预测光纤的某些参数,而这些参数直接影响着光纤的质量。但是每个生产专家的判断标准是不一致,并且生产量变大、制作工艺有差距等因素,导致专家规则难以固化,难以形成一套完成的生产规则系统。本发明在传统光纤生产过程的基础上,一种基于回归决策树的光纤生产规则制定方法,数据预处理操作能有效的剔除数据中的冗余信息,特征选择能提炼出特征中的有效信息,既能提高算法的效率,还能提高算法的精准度。本发明采用回归决策树的机器学习方法,通过交叉验证法不断的优化回归决策树模型,根据决策树分裂路径获取准确的光纤生产规则。
发明内容
本发明旨在解决以上现有技术的问题。提出了一种准确地获取光纤生产中的规则,并对这些规则进行固化,进而有效地提高光纤生产水平的基于回归决策树的光纤生产规则制定方法。本发明的技术方案如下:
一种基于回归决策树的光纤生产规则制定方法,其包括以下步骤:
101.收集光纤生产过程中光棒的测量数据形成光棒特征表,收集光纤的测量数据形成光纤表,并对光棒特征数据和光纤数据进行噪声处理和缺失值处理预操作;
102.102.链接光棒特征数据和光纤数据,对光棒特征数据进行特征工程操作;
103.建立决策回归树模型;用光棒特征数据作为模型的特征,光纤标签数据的某个标签数据作为模型的标签,建立回归决策树模型,
104.通过参数调节和交叉验证来对回归决策树模型进行调优,选择模型中平均绝对误差值低的模型作为最终的模型;
105.根据回归决策树模型的分裂路径,获取多条由光棒特征和光纤标签组成的多条光纤生产规则。
进一步的,所述步骤101收集光纤生产过程中光棒的测量数据形成光棒特征表,收集光纤的测量数据形成光纤表,并对光棒数据和光纤数据进行预处理操作:根据光棒特征表、光纤表的描述以及物理理解进行如下处理:
①光棒数据和光纤数据中存在光纤小盘筛选长度为负值,占比值大于1的异常值,对于这些异常值进行去除该行数据的操作;
②如果某些特征值出现缺失的情况,那么就使用热卡填充法寻找与它最相似的数据值进行补充。
进一步的,所述热卡填充法是指对于一个包含缺失值的行数据,热卡填充法在完整数据中找到与它余弦相似度最高的行数据,然后用该行数据对应的值来对缺失值进行填充。
进一步的,所述步骤102对光棒数据进行特征工程构建操作,具体包括:过滤光棒数据中小盘编号和日期字段的数据,剩余数据作为模型的特征。
进一步的,所述步骤103建立决策回归树模型具体包括:用光棒特征数据作为模型的特征,光纤标签数据的某个标签数据作为模型的标签,建立回归决策树模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811542570.8/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





