[发明专利]一种暂态评估特征选择方法及装置有效
申请号: | 201710059643.7 | 申请日: | 2017-01-24 |
公开(公告)号: | CN106897821B | 公开(公告)日: | 2023-07-21 |
发明(设计)人: | 张春;张军;于之虹;杨超平;鲁广明;张爽;戴红阳;高峰;田蓓;田芳;马军;李岩松;马天东;苏明昕 | 申请(专利权)人: | 中国电力科学研究院;国家电网公司;国网宁夏电力公司电力科学研究院;国网宁夏电力公司 |
主分类号: | G06Q10/0639 | 分类号: | G06Q10/0639;G06Q50/06 |
代理公司: | 北京安博达知识产权代理有限公司 11271 | 代理人: | 徐国文 |
地址: | 100192 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 评估 特征 选择 方法 装置 | ||
本发明提供了一种暂态评估特征选择方法及装置,该法包括:构建加权随机森林模型;从计算的特征重要性中删除重要性最低的特征;对删除后保留的技术特征进行最终特征排序;根据袋外数据OOB错误率曲线变化情况,保留排名靠前的特征。本发明提供的技术方案的加权随机森林通过引入少数失稳样本数据权重因子即可有效减少不平衡数据对特征选择的影响,能选择出比普通随机森林算法性能更优的特征子集;无需人工设定阀值大小,确保了选取特征子集的合理性。
技术领域
本发明属于地理系统安全稳定分析技术领域,具体讲涉及一种暂态评估特征选择方法及装置。
背景技术
电力系统暂态稳定评估(transient stability assessment,TSA)是保证电力系统安全稳定运行的重要手段之一。随着特高压交直流混联大电网格局的逐步形成,电力系统安全稳定特性与机理日趋复杂,电网的运行控制难度不断加大,对电力系统暂态稳定评估的精准提出了新的要求。近年来随着计算机技术的快速发展,基于机器学习技术的暂态稳定评估方法具有在线评估速度快、挖掘潜在信息等优势,在暂态稳定评估中具有很好的发展前景。然而,由于电力系统稳定状态样本数量巨大、特征量差别非常小,形成大量的相近特征。对于大多数机器学习预测和分类算法,如果输入特征集中包含大量与输出目标无关或关联不大的特征,会降低预测的效率和精度,且输入特征维数越高,稳定评估算法的设计和训练越困难,因此为了避免过度拟合,改进预测性能及提高效率,进行特征选择、删除不相关的冗余特征是数据处理过程中必不可少的步骤。
针对电力系统暂态稳定评估的特征选择问题,已有国内外学者做了相关研究。目前已有文献利用随机森林算法对初始确定的特征量进行重要性排序计算,删除部分重要性低的特征。随机森林是(random forest,RF)是加州伯克利分校的Breiman Leo提出的一种集成的统计学习方法,具有准确率高、不容易出现过拟合等优点,是目前最流行的机器学习算法之一。现有技术虽然可以利用随机森林对特征重要性排序但未考虑实际电力系统在线历史数据中稳定样本多而失稳样本极少的特点,并且未给出选择阀值确定的标准。
因此,需要提供一种基于随机森林和递归特征消除策略相结合的组合式特征选择算法用于暂态稳定评估过程中的特征选择,克服原算法的不足。
发明内容
针对现有技术的不足,本发明提出了一种暂态评估特征选择方法及装置。
一种暂态评估特征选择方法,所述方法包括:
I、构建加权随机森林模型,得到特征重要性和袋外数据OOB错误率;
II、从计算的特征重要性中删除重要性最低的特征;
III、对删除后保留的特征进行最终特征排序;
IV、根据袋外数据OOB错误率曲线变化情况,保留最终特征排序排名靠前的特征。
进一步的,所述步骤II的所述特征重要性的计算包括:
用Gini系数衡量分裂过程中节点n的样本不纯度;
计算分裂后节点n的样本不纯度的下降量;
根据样本不纯度的下降量,确定特征变量Xi的特征重要性。
进一步的,所述节点n的样本不纯度i如下式所示:
其中,p(j)为节点n中属于类别j的样本所占的比例。
进一步的,所述节点n分裂为左子节点和右子节点,所述分裂后节点n的样本不纯度的下降量Δi如下式所示:
Δi=i-(pleft·ileft+pright·iright)
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电力科学研究院;国家电网公司;国网宁夏电力公司电力科学研究院;国网宁夏电力公司,未经中国电力科学研究院;国家电网公司;国网宁夏电力公司电力科学研究院;国网宁夏电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710059643.7/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理