[发明专利]决策树生成装置、决策树生成方法、非暂时性记录介质以及提问系统在审
申请号: | 201710342621.1 | 申请日: | 2017-05-16 |
公开(公告)号: | CN107577689A | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 山上胜义;远藤充 | 申请(专利权)人: | 松下知识产权经营株式会社 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;G06K9/62;G16H50/20 |
代理公司: | 北京市中咨律师事务所11247 | 代理人: | 林娜,段承恩 |
地址: | 日本*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 决策树 生成 装置 方法 暂时性 记录 介质 以及 提问 系统 | ||
1.一种决策树生成装置,具备:
信息增益算出部,在以决策树的形式将包含对相互不同的多个属性中的每一个分配了属性值而成的多个分类对象数据的分类对象数据集合分阶段地分割为部分集合时,按分割前的数据集合所包含的所述分类对象数据的每个所述属性,算出由分割导致的数据集合的熵的减少量,基于所述熵的减少量和可靠度,按每个所述属性算出利用该属性的属性值将所述分割前的数据集合分割时的信息增益,所述可靠度是表示用户对询问所述属性的提问的回答的准确性或不准确性的指标;和
决策树制作部,通过递归地反复进行利用具有按每个所述属性算出的多个信息增益中的最大的信息增益的属性的属性值将所述分割前的数据集合分割的处理,从而将具有所述最大的信息增益的属性依次决定为决策树的节点,并且向该节点的边依次分配具有所述最大的信息增益的属性的属性值,制作用于决定提问的顺序的决策树,所述提问是为了将所述多个分类对象数据分类而询问所述多个属性中的每一个的提问。
2.根据权利要求1所述的决策树生成装置,
还具备可靠度算出部,所述可靠度算出部根据用户回答实例数据,按每个所述属性算出所述可靠度,所述用户回答实例数据包括用户对询问所述属性的提问的回答的正确回答和错误回答的实例,
所述信息增益算出部基于由所述可靠度算出部算出的可靠度和所述熵的减少量,按每个所述属性算出利用该属性的属性值将所述分割前的数据集合分割时的信息增益。
3.根据权利要求1或2所述的决策树生成装置,
所述可靠度包含用户对询问所述属性的提问的回答的正确率,
所述信息增益算出部通过将所述正确率乘以所述熵的减少量,从而算出所述信息增益。
4.根据权利要求3所述的决策树生成装置,
所述用户回答实例数据还包含到用户回答提问为止的回答时间,
所述正确率包含根据所述回答时间与所述正确率的相关关系求出的用户的相对于平均回答时间的正确率,
所述信息增益算出部通过将相对于所述平均回答时间的正确率乘以所述熵的减少量,从而算出所述信息增益。
5.根据权利要求1或2所述的决策树生成装置,
所述可靠度包含对于询问预定属性的提问得到成为回答的预定属性值时的带条件的熵,
所述信息增益算出部通过从所述熵的减少量减去所述带条件的熵,从而算出所述信息增益。
6.根据权利要求2~5中任一项所述的决策树生成装置,
所述用户回答实例数据还包含表示用户的属性的用户信息,
所述可靠度算出部按每个所述用户的属性,根据所述用户回答实例数据按每个所述属性算出所述可靠度,
所述信息增益算出部基于所述可靠度和所述熵的减少量,按每个所述用户的属性算出所述信息增益。
7.根据权利要求1所述的决策树生成装置,
所述决策树制作部根据所述多个分类对象数据制作一个决策树。
8.根据权利要求1所述的决策树生成装置,
所述决策树制作部进行如下处理:
将所述分类对象数据集合设定为所述分割前的数据集合的初始值,
使所述信息增益算出部按每个所述属性算出利用该属性的属性值将所述设定的分割前的数据集合分割为多个部分集合时的所述信息增益,
将具有所述最大的信息增益的属性决定为将所述设定的分割前的数据集合分割的节点,
利用具有所述最大的信息增益的属性的属性值,将所述分割前的数据集合分割为多个部分集合,
对所述多个部分集合中的每一个,标记具有所述最大的信息增益的属性,
对所述多个部分集合中的每一个,将该部分集合新设定为所述分割前的数据集合,
对所述新设定的分割前的数据集合,递归地反复进行所述算出、所述决定、所述分割以及所述标记,
使所述信息增益算出部算出利用所述多个属性中的、没有进行所述标记的属性的属性值将所述设定的分割前的数据集合分割时的所述信息增益。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于松下知识产权经营株式会社,未经松下知识产权经营株式会社许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710342621.1/1.html,转载请声明来源钻瓜专利网。