[发明专利]大数据环境下的小水电清理整改评价指标筛选策略在审

专利信息
申请号: 202110845532.5 申请日: 2021-07-26
公开(公告)号: CN113762712A 公开(公告)日: 2021-12-07
发明(设计)人: 李滨;王明敏;祝云;郭青青;李佩杰;陈碧云;白晓清;阳育德;韦化 申请(专利权)人: 广西大学
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q50/06;G06K9/62
代理公司: 南宁图耀专利代理事务所(普通合伙) 45127 代理人: 陈剑锋
地址: 530000 广西壮族*** 国省代码: 广西;45
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 数据 环境 小水电 清理 整改 评价 指标 筛选 策略
【权利要求书】:

1.一种大数据环境下的小水电清理整改评价指标筛选策略,其特征在于包括如下步骤:

步骤1,建立小水电清理整改评价指标库:

步骤2,使用随机森林模型进行小水电清理整改评价指标筛选,包括:

步骤2.1,选择随机森林分类器模型来确定评价指标集的小水电清理整改分类效果,模型参数均采用默认值;

步骤2.2,从步骤1的评价指标库开始,每进行一次随机森林仿真训练,剔除一个最小重要度评价指标,生成不同的评价指标子集;评价指标重要度计算方法为:

a)对于C个类别标签,某决策树节点的数据集D的基尼值计算公式为:

上述式中,pi表示数据集D中第i类样本所占的比例;

b)对于随机森林中包含数据集D的第i棵树节点j在评价指标xk作用下分裂生成两个新的树节点,该两个新的树节点的数据集分别为Dl和Dr,数据集D在评价指标xk作用下的基尼指数计算公式为:

其中|D|、|Dl|、|Dr|分别为数据集D、Dl、Dr的样本总数;

c)根据步骤a)和b)得到随机森林中包含数据集D的第i棵树节点j在评价指标xk作用下的基尼指数,然后计算其变化量得出基尼增益,计算公式为:

d)假设第i棵树中以评价指标xk作为分裂指标的节点都存在于集合J,则评价指标xk在第i棵树的重要度计算公式为:

e)对于m个评价指标,总共生成n棵树的随机森林模型,评价指标xk的重要度通过归一化来求取:

步骤2.3,对所有随机森林仿真所得的袋外样本估计准确率进行曲线拟合,确定袋外样本估计准确率曲线变化拐点,并以拐点所对应的评价指标子集作为最终的小水电清理整改评价指标。

2.根据权利要求1所述的大数据环境下的小水电清理整改评价指标筛选策略,其特征在于,所述步骤2.3中,确定袋外样本估计准确率曲线变化拐点的步骤为:

a)对所有仿真所得的袋外样本估计准确率的拟合曲线公式进行求导,得到拟合曲线求导后的公式。

b)对拟合曲线求导后的公式取对数,以最小对数值所对应的仿真次数作为袋外样本估计准确率曲线变化拐点。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广西大学,未经广西大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202110845532.5/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top