[发明专利]深度森林模型开发和训练在审
申请号: | 202080018916.3 | 申请日: | 2020-03-06 |
公开(公告)号: | CN113557534A | 公开(公告)日: | 2021-10-26 |
发明(设计)人: | 许静;王锐;马小明;杨继辉;张雪英;J·J·许;韩四儿 | 申请(专利权)人: | 国际商业机器公司 |
主分类号: | G06N7/02 | 分类号: | G06N7/02 |
代理公司: | 北京市中咨律师事务所 11247 | 代理人: | 于静;刘薇 |
地址: | 美国*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 深度 森林 模型 开发 训练 | ||
1.一种用于开发和训练用于分析数据的模型的计算机实现的方法,该方法包括:
通过以下步骤构造模型:
由一个或多个计算机处理器从数据集生长决策树的随机森林;
由一个或多个计算机处理器确定对于所述随机森林的袋外(OOB)预测;
由一个或多个计算机处理器将所述袋外预测附加到所述数据集;
由一个或多个计算机处理器使用具有附加的OOB预测的数据集来生长另外的随机森林;并且
由一个或多个计算机处理器用合并器合并所述另外的随机森林的输出。
2.根据权利要求1所述的方法,其中,每个随机森林都是从选自下组的数据生长的,该组由以下各项组成:数字、文本、音频、视频、图像数据位置、语音、音乐、娱乐、医疗保健、财务信息、车辆、物流、以及销售数据。
3.根据权利要求1所述的方法,其中,使用数据集来生长所述决策树的随机森林包括:使用自举样本来生长决策树,以生长每个树,所述自举样本是有替换地取自所述数据集。
4.根据权利要求1所述的方法,进一步包括:确定每个随机森林的OOB精确度,并且添加随机森林,直到所述OOB精确度没有显著提高。
5.根据权利要求1所述的方法,其中,所述合并器包括选自由随机森林和梯度提升结构组成的组中的结构。
6.根据权利要求1所述的方法,其中,所述模型包括层序列,每层包括单个随机森林。
7.一种用于开发和训练用于分析数据的模型的计算机程序产品,所述计算机程序产品包括一个或多个计算机可读存储设备和存储在所述一个或多个计算机可读存储设备上的程序指令,所述程序指令包括:
编程指令,当由一个或多个计算机处理器执行时,所述编程指令使所述处理器执行如权利要求1至6中任一项所述的方法的步骤。
8.一种用于开发和训练用于分析数据的模型的计算机系统,所述计算机系统包括:
一个或多个计算机处理器;
一个或多个计算机可读存储设备;
存储在所述一个或多个计算机可读存储设备上的用于由所述至少一个计算机处理器执行的程序指令,所述程序指令包括:
编程指令,当由所述一个或多个计算机处理器执行时,所述编程指令使所述计算机处理器执行如权利要求1至6中任一项所述的方法的步骤。
9.根据权利要求1所述的方法,包括:
由一个或多个计算机处理器接收训练数据集;
确定所述随机森林的OOB精确度;
由一个或多个计算机处理器确定所述另外的随机森林的OOB精确度;
由一个或多个计算机处理器比较所述随机森林和所述另外的随机森林的OOB精确度。
10.根据权利要求9所述的方法,包括:
通过以下步骤构建顺序层的模型,每一层包括单个随机森林:
由一个或多个计算机处理器接收训练数据集;
由一个或多个计算机处理器接收每个森林的确定数量的树和类向量规范;
由一个或多个计算机处理器使用所述训练数据集为第一森林增长所确定的树的数量;
由一个或多个计算机处理器确定对于所述第一森林的第一包外(OOB)预测;
由一个或多个计算机处理器将OOB预测附加到所述数据集;
由一个或多个计算机处理器确定所述第一森林的OOB精确度;
由一个或多个计算机处理器,使用附加有OOB预测的训练数据集合,为另外的森林增加所确定的树的数量;
由一个或多个计算机处理器确定用于所述另外的森林的另外的OOB预测;
由一个或多个计算机处理器将另外的OOB预测附加到所述数据集;
由一个或多个计算机处理器确定所述另外的森林的另外的OOB精确度;
由一个或多个计算机处理器添加森林,直到所述另外的OOB精确度未提高;并且
由一个或多个计算机处理器合并所述另外的森林的输出。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国际商业机器公司,未经国际商业机器公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202080018916.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:控制器系统
- 下一篇:用于运载工具的操作单元