[发明专利]一种基于任务并行的细粒度分布式深度森林训练方法在审
申请号: | 202010193428.8 | 申请日: | 2020-03-18 |
公开(公告)号: | CN111414961A | 公开(公告)日: | 2020-07-14 |
发明(设计)人: | 朱光辉 | 申请(专利权)人: | 江苏鸿程大数据技术与应用研究院有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京联瑞联丰知识产权代理事务所(普通合伙) 11411 | 代理人: | 周超 |
地址: | 210000 江苏省南京市江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 任务 并行 细粒度 分布式 深度 森林 训练 方法 | ||
1.一种基于任务并行的细粒度分布式深度森林训练方法,其特征在于,包括以下步骤:
(a)在深度森林的每一层,其中每一个森林被拆分成多个均匀的子森林,其中每个子森林对应一个计算任务;
(b)为子森林设置合适的随机状态,为子森林训练时的交叉验证设置合适的随机状态;
(c)将子森林训练任务发放到各个计算节点执行;
(d)采用基于树形规约树的分层树形合并法将属于同一个随机森林的子森林的结果合并,得到该原始随机森林的训练结果,完成多个森林的并行训练。
2.根据权利要求1所述的基于任务并行的细粒度分布式深度森林训练方法,其特征在于,在步骤(a)中子森林拆分方法产生的级联层输出类向量与非拆分的方法产生的级联层输出类向量一致。
3.根据权利要求1所述的基于任务并行的细粒度分布式深度森林训练方法,其特征在于,在步骤(a)中将子森林训练任务随机和独立地发送到集群中的各个计算节点执行。
4.根据权利要求1所述的基于任务并行的细粒度分布式深度森林训练方法,其特征在于,在步骤(d)中还包括以下步骤:
(d1)子森林的结果首先发送给底层工作节点;
(d2)本地合并结果后进一步发送给上层工作节点;
(d3)最后,由主节点对所有合并后的完整森林的结果进行合并。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏鸿程大数据技术与应用研究院有限公司,未经江苏鸿程大数据技术与应用研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010193428.8/1.html,转载请声明来源钻瓜专利网。