[发明专利]样本特征重要性的确定方法及装置,电子设备在审
申请号: | 201810130132.4 | 申请日: | 2018-02-08 |
公开(公告)号: | CN108416368A | 公开(公告)日: | 2018-08-17 |
发明(设计)人: | 徐俊;李尚强;翟艺涛 | 申请(专利权)人: | 北京三快在线科技有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 北京润泽恒知识产权代理有限公司 11319 | 代理人: | 莎日娜 |
地址: | 100083 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 样本特征 样本 输入样本 叶子节点 树模型 重要性评估 预测 计算机技术领域 决策 递归计算 电子设备 父节点 申请 覆盖 | ||
本申请涉及一种样本特征重要性的确定方法,属于计算机技术领域,解决现有技术中无法对单个样本的特征进行重要性评估的问题。所述方法包括:根据树模型各叶子节点覆盖的样本数量和各所述叶子节点对应的样本预测分数,递归计算所述树模型每条决策路径上所述叶子节点的父节点以上各层中每个节点对应的样本预测分数;通过所述树模型对输入样本进行预测,确定所述输入样本的决策路径;根据所述决策路径上各节点对应的所述样本预测分数和所述样本特征,确定所述输入样本的每个样本特征的重要性。本申请公开的样本特征重要性的确定方法可以实现对单个样本的每个样本特征的重要性评估。
技术领域
本申请涉及计算机技术领域,特别是涉及一种样本特征重要性的确定方法及装置,电子设备。
背景技术
随着互联网技术的发展,海量数据的处理和应用日益重要。通过机器学习的方法,利用海量数据训练机器模型,用于业务指标等应用日益广泛。通常的做法是:首先,基于训练样本提取预设特征;然后,基于提取的样本特征训练机器学习模型;最后,通过训练好的机器学习模型进行业务指标(如点击率、曝光率等)的预估。现有技术中,对于业务层面,训练得到的机器学习模型就是个黑盒子,无法解释样本特征和预估的业务指标之间的关系。例如,在预测场景中,通过训练的机器学习模型预测一个商圈的热度时,无法告诉商家哪些特征导致该商圈热度发生变化;在推荐排序场景中,通过训练的机器学习模型给用户推荐了一家餐厅,却无法给出推荐原因。
现有技术中的一种样本特征的重要性确定方法的具体方案为:首先结合不同的重要性未知的样本特征训练相应复合机器学习模型,然后,通过比较不同复合机器学习模型的表现预估相应样本特征的重要性。
可见,现有技术中的样本特征的重要性确定方法,仅能对全部样本的某个特征的重要性进行评估,而无法对某个样本的某个特征的重要性进行评估。
发明内容
本申请提供一种样本特征重要性的确定方法,至少解决现有技术中的样本特征重要性的确定方法无法对单个样本的特征进行重要性评估的问题。
为了解决上述问题,第一方面,本申请实施例提供了一种样本特征重要性的确定方法包括:
根据树模型各叶子节点覆盖的样本数量和各所述叶子节点对应的样本预测分数,递归计算所述树模型每条决策路径上所述叶子节点的父节点以上各层中每个节点对应的样本预测分数,其中,所述叶子节点的父节点以上各层中每个节点对应一个样本特征;
根据所述决策路径上各节点对应的所述样本预测分数和所述样本特征,确定所述输入样本的每个样本特征的重要性。
第二方面,本申请实施例提供了一种样本特征重要性的确定方法包括:
样本预测分数计算模块,用于根据树模型各叶子节点覆盖的样本数量和各所述叶子节点对应的样本预测分数,递归计算所述树模型每条决策路径上所述叶子节点的父节点以上各层中每个节点对应的样本预测分数,其中,所述叶子节点的父节点以上各层中每个节点对应一个样本特征;
决策路径确定模块,用于通过所述树模型对输入样本进行预测,确定所述输入样本的决策路径;
样本特征重要性确定模块,用于根据所述决策路径上各节点对应的所述样本预测分数和所述样本特征,确定所述输入样本的每个样本特征的重要性。
第三方面,本申请实施例还公开了一种电子设备,包括存储器、处理器及存储在所述存储器上并可在处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现本申请实施例所述的样本特征重要性的确定方法。
第六方面,本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时本申请实施例公开的样本特征重要性的确定方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京三快在线科技有限公司,未经北京三快在线科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810130132.4/2.html,转载请声明来源钻瓜专利网。