[发明专利]基于增强回归树算法的面向二值分类的因子筛选方法有效
申请号: | 201710670847.4 | 申请日: | 2017-08-08 |
公开(公告)号: | CN107608938B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 支俊俊 | 申请(专利权)人: | 安徽师范大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18 |
代理公司: | 安徽合肥华信知识产权代理有限公司 34112 | 代理人: | 余成俊 |
地址: | 241002 *** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于增强回归树算法的面向二值分类的因子筛选方法,(1)、数据搜集,建立目标变量‑预测因子数据集;(2)、基于目标变量和全部因子利用增强回归树算法建模,计算因子重要性并排序;(3)、对全部因子进行相关性分析,分析皮尔逊相关矩阵并进行筛选;(4)、基于目标变量和保留下来的因子利用增强回归树算法建立新的模型,计算预测偏差,计算因子重要性并排序,剔除重要性最小的因子,直至保留下来的因子数量≤2;(5)、比较步骤(4)中各增强回归树模型的预测偏差,将预测偏差最小的增强回归树模型所采用的全部因子作为最佳因子组合。本发明建立了定量化的因子选取体系,结果可靠,应用领域广。 | ||
搜索关键词: | 基于 增强 回归 算法 面向 分类 因子 筛选 方法 | ||
【主权项】:
一种基于增强回归树算法的面向二值分类的因子筛选方法,其特征在于:具体包括以下步骤:(1)、搜集用于二值分类的目标变量和预测因子,建立目标变量‑预测因子数据集;(2)、基于目标变量和全部预测因子,利用增强回归树算法建立增强回归树模型,计算各预测因子重要性并排序;(3)、对全部预测因子进行相关性分析,分析皮尔逊相关矩阵并进行筛选,对于皮尔逊相关系数绝对值≥0.80的因子组合,根据步骤(2)计算的因子重要性保留该因子组合中重要性最大的因子,并剔除该因子组合中的其他全部因子;(4)、基于目标变量和保留下来的因子,利用增强回归树算法建立新的增强回归树模型,计算预测偏差,计算因子重要性并排序,剔除重要性最小的因子,若剔除重要性最小的因子后保留下来的因子数量>2,则基于目标变量和这些保留下来的因子重复执行本步骤直至保留下来的因子数量≤2;(5)、比较步骤(4)中各增强回归树模型的预测偏差,将预测偏差最小的增强回归树模型所采用的全部预测因子作为最佳预测因子组合。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于安徽师范大学,未经安徽师范大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710670847.4/,转载请声明来源钻瓜专利网。