[发明专利]随机森林的训练方法、装置、存储介质和电子设备有效
申请号: | 201811557768.3 | 申请日: | 2018-12-19 |
公开(公告)号: | CN109829471B | 公开(公告)日: | 2021-10-15 |
发明(设计)人: | 高睿;于福超 | 申请(专利权)人: | 东软集团股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京英创嘉友知识产权代理事务所(普通合伙) 11447 | 代理人: | 李鹏;魏嘉熹 |
地址: | 110179 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本公开涉及一种随机森林的训练方法、装置、存储介质和电子设备,该方法包括:通过n组训练数据集训练出包含n棵树的随机森林;通过随机森林中的每棵树对应的描述数据对每棵树进行评判,以获取每棵树对应的目标预测结果;当任一棵树的正确率小于预设阈值时,根据每棵树的正确率,将该n棵树合并为m棵树;并获取该m棵树对应的m组训练数据集;以m组训练数据集为基础,循环执行上述步骤,直至获取到每棵树对应的目标预测结果的正确率都大于或等于该预设阈值的随机森林。能够在对随机森林的多次训练过程中持续对训练数据分布和模型数量进行改动,在保证随机森林分类预测的泛化性的同时,强化关键的训练数据的作用,提高随机森林分类预测的精确度。 | ||
搜索关键词: | 随机 森林 训练 方法 装置 存储 介质 电子设备 | ||
【主权项】:
1.一种随机森林的训练方法,其特征在于,所述方法包括:通过第一训练数据训练出随机森林,所述第一训练数据包含n组训练数据集,所述随机森林包含n棵树,所述训练数据集包含描述数据和预测结果;通过所述随机森林中的每棵树对应的训练数据集中的描述数据对所述每棵树进行评判,以获取所述每棵树对应的目标预测结果;当所述随机森林中任一棵树对应的目标预测结果的正确率小于预设阈值时,根据所述每棵树对应的目标预测结果的正确率,将所述n棵树合并为m棵树,其中,m小于或等于n;将所述m棵树对应的m组描述数据与m个目标预测结果合成为m组训练数据集,作为第二训练数据;将所述第二训练数据作为所述第一训练数据,循环执行从所述通过第一训练数据训练出随机森林到所述将所述m棵树对应的m组描述数据与m个目标预测结果合成为m个训练数据集的步骤,直至获取到目标随机森林,所述目标随机森林中的每棵树对应的目标预测结果的正确率都大于或等于所述预设阈值。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东软集团股份有限公司,未经东软集团股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811557768.3/,转载请声明来源钻瓜专利网。