[发明专利]基于完全随机森林的矢量空间计算强度预测方法及系统有效
申请号: | 201711387102.3 | 申请日: | 2017-12-20 |
公开(公告)号: | CN108052755B | 公开(公告)日: | 2019-09-17 |
发明(设计)人: | 郭明强;黄颖;谢忠;关庆锋;吴亮;刘袁缘 | 申请(专利权)人: | 中国地质大学(武汉) |
主分类号: | G06F17/50 | 分类号: | G06F17/50;G06F16/56 |
代理公司: | 武汉知产时代知识产权代理有限公司 42238 | 代理人: | 冯必发 |
地址: | 430074 湖*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 一种基于完全随机森林的矢量空间计算强度预测方法及系统,通过输入与矢量空间计算强度相关的所有特征,训练多棵完全回归决策树,实现对特征复杂多样的矢量空间计算域的计算强度建模,并对完全随机森林的预测结果进行优化,剔除与预测结果偏差较大的预测值,提高完全随机森林的预测精度,有利于在并行计算环境中,对矢量空间计算强度进行精准的预测。本发明在随机森林的训练过程中,每棵回归决策树的训练样本是从原始样本中随机选择的,且选择的特征包括原始样本的全部特征,该模型能够应对重要特征少、冗余特征多的矢量空间计算强度的预测,本发明可以为并行计算资源均衡调度与分配提供依据,提高并行计算效率。 | ||
搜索关键词: | 基于 完全 随机 森林 矢量 空间 计算 强度 预测 方法 系统 | ||
【主权项】:
1.一种基于完全随机森林的矢量空间计算强度预测方法,其特征在于,包括以下步骤:S1、获取矢量空间计算强度原始样本集,每个矢量空间计算强度样本中均包括以下13个类型的数值:矢量图层包含的要素个数、要素几何类型、数据库类型、图层空间范围宽度、图层空间范围高度、空间计算域内要素个数、空间计算域内顶点数、窗口像素宽度、窗口像素高度、窗口地理宽度、窗口地理高度、容差半径、计算时间;使用二维数组RawSamples[i][j]存储矢量空间计算强度原始样本集,RawSamples[i][j]表示第i个样本第j个属性值;S2、使用整型随机数生成器,生成N个大于等于0且小于N的整型数值,使用生成的N个整型数值,将其分别作为数组索引从原始样本集的各个样本中选取N个样本作为新的样本,将其存储到二维数组TreeSamples[i][j]中;其中,N为原始样本集中样本数量;S3、采用回归决策树训练方法,利用步骤S2中得到的二维数组TreeSamples[i][j]进行训练,建立回归决策树;S4、循环执行S2至S3,直到获得TN棵回归决策树,TN棵回归决策树构成了完全随机森林FRF;其中TN为完全随机森林中回归决策树的数量;S5、获取待预测的矢量空间计算强度样本集,每个待预测的矢量空间计算强度样本包含以下12个类型的数值:矢量图层包含的要素个数、要素几何类型、数据库类型、图层空间范围宽度,图层空间范围高度、空间计算域内要素个数、空间计算域内顶点数、窗口像素宽度,窗口像素高度、窗口地理宽度、窗口地理高度、容差半径;使用一维数组NewSample存储待预测样本,NewSample[i]表示待预测样本的第i个属性值,将待预测的矢量空间计算强度样本输入到FRF中,调用FRF中的TN棵回归决策树的预测方法对待预测样本的计算时间进行预测,获得TN个预测结果,计算TN个预测结果的平均值AVG;S6、分别计算TN棵回归决策树的预测结果与AVG之间的差值的绝对值,判断该差值的绝对值是否大于AVG*R,其中R是预先设定的百分比,如果回归决策树的预测结果与AVG之间的差值的绝对值大于AVG*R,则将其剔除,反之保留;S7、计算S6中保留下来的回归决策树的预测结果的平均值FINALAVG,将平均值FINALAVG作为最终的计算强度预测结果。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国地质大学(武汉),未经中国地质大学(武汉)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201711387102.3/,转载请声明来源钻瓜专利网。