[发明专利]基于粒子群优化的双准确度加权随机森林算法在审
申请号: | 202010223029.1 | 申请日: | 2020-03-26 |
公开(公告)号: | CN111428790A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 张文波;冯永新;郝颖;付立冬;王晶 | 申请(专利权)人: | 沈阳理工大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/00 |
代理公司: | 常州市科谊专利代理事务所 32225 | 代理人: | 孙彬 |
地址: | 110159 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 粒子 优化 准确度 加权 随机 森林 算法 | ||
1.基于粒子群优化的双准确度加权随机森林算法,其特征在于,包括以下步骤:Step1:确定原始数据集D={(x1,y1),(x2,y2),...(xN,yN)},其中,为输入实例,n为总特征个数,yi∈{Y1,Y2,...,YN}为类标记,i=1,2,...,N,N为样本容量,随机确定决策树棵数K、决策树的特征个数m,其中,m≤n,确定预测试样本率X,所述预测试样本率为预测试数据集个数与数据集总数之比;
Step2:根据预测试样本率X对原始数据集D进行划分,生成第k棵决策树对应的预测试数据集Pk以及训练数据集Sk,并使用Bootstrap采样法对训练数据集Sk采样,获得袋外数据Ok,训练子集Tk;
Step3:从n个特征中随机选取m个特征属性作为节点分类特征,Tk作为训练数据,根据C4.5算法生成第k棵决策树;并使用该决策树测试Ok、Pk数据集,根据公式(1)和公式(2)计算该决策树的权重wOk和wPk,根据公式(3)计算该决策树的最终权重wk:
Step4:重复Step2和Step3,直至决策树棵数为K时停止,获得决策树集合以及每棵决策树的权重;
Step5:使用决策树集合对测试数据进行测试并根据公式(4)进行分类,并获得随机森林算法的准确率:
Step6:将Step5得到的准确率作为粒子群的适应度值,采用粒子群优化算法对决策树棵数K和预测试样本率X超参数进行迭代优化,并与历史分类准确率进行对比,最终选出最优模型参数。
2.根据权利要求1所述的基于粒子群优化的双准确度加权随机森林算法,其特征在于,所述Step6中的粒子群优化算法的具体步骤如下:
S6-1:将决策树棵树K、预测试样本率X组成一个空间向量(K,X)作为粒子群优化算法中的一个粒子,所述粒子在整个搜索空间中以均匀随机的方式进行初始化;
S6-2:更新每个维度中每个粒子的速度和位置,且在每个时间步长对整个鸟群进行更新,其中,所述粒子的速度和位置的矢量公式如公式(5)和公式(6)所示:
vid=w×vid+c1×rand×(pid-xid)+c2×rand×(pgd-xid) (5);
xid=xid+vid (6);
其中,w为惯性权重,取值范围通常是0.4~1.2,rand()是随机函数,产生[0,1]范围内的随机数,c1和c2为加速常数,表示粒子对种群的认知。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于沈阳理工大学,未经沈阳理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010223029.1/1.html,转载请声明来源钻瓜专利网。