[发明专利]分类模型的训练方法、预测方法及装置有效
申请号: | 201910512732.1 | 申请日: | 2019-06-13 |
公开(公告)号: | CN110363302B | 公开(公告)日: | 2023-09-12 |
发明(设计)人: | 张雅淋;李龙飞 | 申请(专利权)人: | 创新先进技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F18/241 |
代理公司: | 北京永新同创知识产权代理有限公司 11376 | 代理人: | 林锦辉 |
地址: | 英属开*** | 国省代码: | 暂无信息 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 分类 模型 训练 方法 预测 装置 | ||
本公开提供了分类模型的训练方法、预测方法及装置,训练方法包括:利用训练样本集来训练出第一数目个第一分类子模型;使用第一数目个第一分类子模型来分别对测试样本集中的每个测试样本进行预测,以得到每个测试样本在各个第一分类子模型下的分类预测值;基于每个测试样本在各个第一分类子模型下的分类预测值,从第一数目个第一分类子模型中确定出组成样本分类模型的第二分类子模型以及对应的预测加权因子。利用该方法,通过基于分类子模型的预测效果来确定样本分类模型的分类子模型组成以及对应的预测加权因子,可以使得分类子模型被分配合适的预测加权因子来提升样本分类模型的整体预测效果。
技术领域
本公开涉及机器学习技术领域,具体地,涉及分类模型的训练方法、预测方法及装置。
背景技术
对于样本分类、交易检测等业务,可以利用经过机器学习训练好的模型来进行处理。以样本分类为例,可以利用单个模型来对样本进行预测,进而确定样本的分类。还可以基于集成学习的方式训练出多个子模型,由该多个子模型组成样本分类模型,并利用该样本分类模型来对样本进行预测并确定样本的分类。
在利用由多个子模型组成的样本分类模型对样本进行预测时,每一个子模型均需对样本进行预测,并输出相应的预测结果,再将所有的预测结果进行平均,得到平均结果,该平均结果即为该样本分类模型的最终预测结果。
上述由多个子模型组成的样本分类模型中,仅是简单的将该多个子模型的结果进行平均。然而,各个子模型的预测效果有差异,这样简单的平均会降低样本分类模型的预测效果。尤其是,当样本分类模型所包括的多个子模型中检测效果较差的子模型较多的情况下,则样本分类模型所得到的预测结果中综合了较多的效果较差的预测结果,这样导致样本分类模型输出的最终预测结果的效果较差。
发明内容
鉴于上述,本公开提供了一种分类模型的训练方法、预测方法及装置。利用该分类模型的训练方法、预测方法及装置,通过基于分类子模型的预测效果来确定样本分类模型的分类子模型组成以及对应的预测加权因子,可以使得分类子模型被分配合适的预测加权因子来提升样本分类模型的整体预测效果。
根据本公开的一个方面,提供了一种用于训练分类模型的方法,包括:利用训练样本集来训练出第一数目个第一分类子模型;使用所述第一数目个第一分类子模型来分别对测试样本集中的每个测试样本进行预测,以得到每个测试样本在各个第一分类子模型下的分类预测值;以及基于所述每个测试样本在各个第一分类子模型下的分类预测值,从所述第一数目个第一分类子模型中确定出组成所述样本分类模型的第二分类子模型以及对应的预测加权因子。
可选地,在上述方面的一个示例中,基于所述每个测试样本在各个第一分类子模型下的分类预测值,从所述第一数目个第一分类子模型中确定出组成所述样本分类模型的第二分类子模型以及对应的预测加权因子包括:执行下述循环过程,直到满足循环结束条件:针对当前模型加权因子池中的每个模型加权因子组,基于所述测试样本集中的每个测试样本在各个第一分类子模型下的分类预测值以及该模型加权因子组中对应的模型加权因子,确定候选样本分类模型在该模型加权因子组下的模型性能评估值,所述候选样本分类模型由所述第一数目个第一分类子模型组成,每个模型加权因子组包括所述第一数目个模型加权因子,每个模型加权因子对应于一个第一分类子模型,以及每个模型加权因子组中的模型加权因子之和等于1;在未满足所述循环结束条件时,使用遗传算法来对所述当前模型加权因子池进行更新,以得到更新后的模型加权因子池,其中,所述更新后的模型加权因子池被提供来作为下一循环过程的当前模型加权因子池;基于所确定出的各个模型加权因子组下的模型性能评估值,从所述第一数目个第一分类子模型中确定出组成所述样本分类模型的第二分类子模型以及对应的预测加权因子。
可选地,在上述方面的一个示例中,所述候选样本分类模型的模型性能评估值确定过程是针对所述当前模型加权因子池中的每个未处理模型加权因子组执行的。
可选地,在上述方面的一个示例中,所述循环结束条件为以下条件中的一种:达到预定循环次数;所述当前模型加权因子池中的模型加权因子组的数量达到预设数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于创新先进技术有限公司,未经创新先进技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910512732.1/2.html,转载请声明来源钻瓜专利网。