[发明专利]基于二分类模型的多分类方法、装置、电子设备及介质在审
申请号: | 202110318230.2 | 申请日: | 2021-03-25 |
公开(公告)号: | CN112801222A | 公开(公告)日: | 2021-05-14 |
发明(设计)人: | 庞宇嘉;彭琛;汪伟 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分类 模型 方法 装置 电子设备 介质 | ||
1.一种基于二分类模型的多分类方法,其特征在于,所述方法包括:
从原始数据集中抽取出训练数据集和验证数据集,并对所述训练数据集及验证数据集进行二分类标注;
利用所述训练数据集构建并训练二分类模型,并根据所述验证数据集对所述二分类模型进行验证调整,得到标准二分类模型;
获取待处理数据集,将所述待处理数据集输入至所述标准二分类模型中,得到二分类结果;
对所述标准二分类模型进行解析处理,得到贡献度矩阵;
按照预设的多分类标注对所述贡献度矩阵进行聚合处理,得到贡献度聚合矩阵,并根据所述贡献度聚合矩阵及所述二分类结果,得到多分类结果。
2.如权利要求1所述的基于二分类模型的多分类方法,其特征在于,所述利用所述训练数据集构建并训练二分类模型,包括:
获取所述训练数据集和所述训练数据集对应的二分类标注;
遍历所述二分类标注中每一个标注,并计算每一个所述标注对所述训练数据集的基尼指数,得到所述二分类标注对应的基尼指数集合;
对所述基尼指数集合按照从大到小的顺序进行排序,选取所述基尼指数集合中最小的基尼指数所对应的标注作为切分点;
以所述切分点作为初始决策树的根节点,从所述切分点出发生成子节点并将所述训练数据集分配到所述子节点中,直到将所述二分类标注中的所有标注遍历完毕,生成所述初始决策树;
对所述初始决策树进行剪枝处理,得到二分类模型。
3.如权利要求2所述的基于二分类模型的多分类方法,其特征在于,所述对所述初始决策树进行剪枝处理,包括:
计算所述初始决策树上所有非叶子节点的表面误差增益值;
对所述表面误差增益值小于预设的增益阈值的非叶子节点进行剪枝。
4.如权利要求1所述的基于二分类模型的多分类方法,其特征在于,所述根据所述验证数据集对所述二分类模型进行验证调整,得到标准二分类模型,包括:
利用所述二分类模型对所述验证数据集进行二分类处理,得到所述验证数据集对应的分类结果;
当所述验证数据集对应的分类结果与所述训练数据集对应的二分类标注不一致时,重新利用所述训练数据集对所述二分类模型进行训练,直到所述验证数据集对应的分类结果与所述训练数据集对应的二分类标注一致时,将所述训练完的二分类模型输出为所述标准二分类模型。
5.如权利要求1所述的基于二分类模型的多分类方法,其特征在于,所述按照预设的多分类标注对所述贡献度矩阵进行聚合处理,得到贡献度聚合矩阵,并根据所述贡献度聚合矩阵及所述二分类结果,得到多分类结果,包括:
按照预设的多分类标注将所述贡献度矩阵中的每一列划分为一个类别,按照类别对所述贡献度矩阵进行纵向加总,得到贡献度聚合矩阵;
对所述贡献度聚合矩阵进行纵向归一化,并乘上所述二分类结果,得到多分类结果。
6.如权利要求1所述的基于二分类模型的多分类方法,其特征在于,所述对所述标准二分类模型进行解析处理,得到贡献度矩阵,包括:
通过遍历操作,查找所述标准二分类模型中基于所述二分类标注中每一个标注对应的任意一个节点;
对所述节点进行节点抽取,并提取所述节点的抽取前概率向量和抽取后概率向量;
根据所述抽取前概率向量和所述抽取后概率向量计算所述节点的增益向量;
根据所述标准二分类模型中所有节点的增益向量构建贡献度矩阵。
7.如权利要求6所述的基于二分类模型的多分类方法,其特征在于,所述根据所述抽取前概率向量和所述抽取后概率向量计算所述节点的增益向量,包括:
利用下述增益向量公式计算所述节点的增益向量:
Δpk,n,i=p′-p
其中,Δpk,n,i为增益向量,p为所述抽取前概率向量,p′为所述抽取后概率向量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110318230.2/1.html,转载请声明来源钻瓜专利网。