[发明专利]一种基于集成算法的项目管理供应商决策分析方法在审
申请号: | 202110773655.2 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113657439A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 雷志敏;戴延军;李天;向俊偲;江欢欢 | 申请(专利权)人: | 中冶南方都市环保工程技术股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/12;G06Q10/06;G06Q10/08 |
代理公司: | 北京汇泽知识产权代理有限公司 11228 | 代理人: | 吴静 |
地址: | 430205 湖北省武*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 集成 算法 项目 管理 供应商 决策 分析 方法 | ||
一种基于集成算法的项目管理供应商决策分析方法,包括:通过项目管理平台,对影响决策因素的供应商属性数据进行采集;对采集到的数据进行预处理;读取属性数据信息,判断属性信息是否连续,若属性信息连续,则将连续值按等级进行离散化;将离散化后的数据进行储存,得到训练集,再对训练集进行划分,将其子集利用改进的C4.5算法进行处理,得到初始决策树;通过得到的初始决策树,利用改进集成算法,生成最终决策树,对供应商进行决策。本发明将遗传算法直接用于决策树的优化,由于C4.5算法生成的决策树分类精度较高,利用C4.5算法生成初始的决策树种群,可以有效地避免遗传算法刚开始盲目的搜索,解决了现有技术由于C4.5平衡决策树算法易过拟合的问题。
技术领域
本发明涉及的是数据挖掘分类领域,特别涉及一种基于集成算法的项目管理供应商决策分析方法。
背景技术
目前针对决策分析方法,大多都只考虑使用原始C4.5算法,其无法很好解决C4.5平衡决策树算法过拟合的情况。或者利用其改进算法调整属性增益率的计算方式找出影响决策的原因,亦或是在数据处理阶段对原始数据集进行优化处理,都无法显著提高算法计算时间与分类准确率。
发明内容
鉴于上述问题,提出了本发明以便提供一种克服上述问题或者至少部分地解决上述问题的一种基于集成算法的项目管理供应商决策分析方法。
为了解决上述技术问题,本申请实施例公开了如下技术方案:
本发明公开了一种基于集成算法的项目管理供应商决策分析方法,包括:
S100.通过项目管理平台,对影响决策因素的供应商属性数据进行采集;
S200.对采集到的数据进行预处理;
S300.读取属性数据信息,判断属性信息是否连续,若属性信息连续,则将连续值按等级进行离散化;
S400.将离散化后的数据进行储存,得到训练集,再对训练集进行划分,将其子集利用改进的C4.5算法进行处理,得到初始决策树;
S500.通过得到的初始决策树,利用改进集成算法,生成最终决策树,对供应商进行决策。
进一步地,S100中,影响决策因素的供应商属性数据一共有五种,包括:供货质量、交货期、服务质量、供赁价格、信用度。
进一步地,其特征在于,S200中,对数据进行预处理,至少包括:包括空值处理,数据集整合。
进一步地,其特征在于,S300中,供赁价格及信用度为连续型数据,需划分区间,再取区间等级进行离散化;供货质量、交货期、服务质量为离散数据,无需处理。
进一步地,利用改进的C4.5算法进行处理,具体方法为:首先通过属性数据计算信息熵,引入平衡因子,获得属性信息增益率,得到所有属性信息增益率的结果,选取信息增益率最大的属性作为当前节点的分裂属性,其他属性将会继续进行递归计算,随着属性逐渐的计算,信息增益率将会变得越来越小,选择相对较大的信息增益率的属性作为分类属性,直到最后决策树的生成。
进一步地,S500中,利用改进集成算法进行处理,包括:
S501.利用优化的C4.5算法产生初始决策树,根据决策树给出的数据规则生成相应的规则集;
S502.对规则集进行编码,生成初始种群;
S503.对适应度函数进行确定,利用遗传操作的三个算子,对初始种群中的个体反复进行遗传操作;
S504.通过适应度函数的计算得到较优的个体并逐代保存下来,直到满足终止条件为止;
S505.保留适应度函数值最大的规则集并进行解码,从而得到相对较优的决策树模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中冶南方都市环保工程技术股份有限公司,未经中冶南方都市环保工程技术股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110773655.2/2.html,转载请声明来源钻瓜专利网。