[发明专利]构建决策树分类器的方法及装置有效
申请号: | 201210580719.8 | 申请日: | 2012-12-27 |
公开(公告)号: | CN103902591B | 公开(公告)日: | 2019-04-23 |
发明(设计)人: | 范成林;黄哲学;陈小军 | 申请(专利权)人: | 中国科学院深圳先进技术研究院 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 广州华进联合专利商标代理有限公司 44224 | 代理人: | 吴平 |
地址: | 518055 广东省深圳*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种构建决策树分类器的方法,包括:获取样本数据;构建包含多个子决策树的随机森林分类器;获取所述多个子决策树的节点的分裂属性的出现频率,根据所述出现频率将所述多个子决策树合并成主决策树,且所述主决策树的叶节点对应类标集和叶属性类标签,所述叶属性标签为所述类标集中出现频率最高的类标签;根据所述叶属性类标签合并所述主决策树的叶节点;根据所述主决策树生成决策树分类器。此外,还包括一种构建决策树分类器的装置。上述构建决策树分类器的方法及装置可以提高分类速度。 | ||
搜索关键词: | 构建 决策树 分类 方法 装置 | ||
【主权项】:
1.一种基于决策树分类器的数据分类的方法,包括:获取样本数据;构建包含多个子决策树的随机森林分类器;获取所述多个子决策树的根节点的分裂属性,获取所述根节点的分裂属性的出现频率,根据所述出现频率最大的分裂属性生成主决策树的目标分支节点,且所述主决策树的叶节点对应类标集和叶属性类标签,所述叶属性类标签为所述类标集中出现频率最高的类标签;判断所述目标分支节点的分裂属性是否为数值属性,若是,则获取所述多个子决策树的根节点中分裂属性为数值属性的节点的分裂值,并根据所述分裂值生成所述目标分支节点的子分支节点,移除所述多个子决策树的根节点中分裂属性为数值属性的节点;否则,获取所述多个子决策树的根节点中分裂属性为类别属性的节点的类别取值,并根据所述类别取值生成所述目标分支节点的子分支节点,移除所述多个子决策树的根节点中分裂属性为类别属性的节点;遍历所述主决策树,将所述叶属性类标签相同的所述叶节点缩减为同一个叶节点;根据所述主决策树生成决策树分类器;获取搜索引擎中用户输入的关键字,采用生成的决策树分类器获取所述关键字对应的类标签以使所述搜索引擎对所述关键字分类。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院深圳先进技术研究院,未经中国科学院深圳先进技术研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201210580719.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种汽车换选档软轴机构
- 下一篇:一种车用压缩天然气辅助燃料系统总成