[发明专利]反欺诈预测模型的训练方法及装置、存储介质及电子设备在审
申请号: | 202110690104.X | 申请日: | 2021-06-22 |
公开(公告)号: | CN113344585A | 公开(公告)日: | 2021-09-03 |
发明(设计)人: | 宋雨;程璐;赵辉;杨晓明 | 申请(专利权)人: | 中国银行股份有限公司 |
主分类号: | G06Q20/40 | 分类号: | G06Q20/40;G06Q10/06;G06Q10/04;G06K9/62 |
代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 李伟 |
地址: | 100818 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 欺诈 预测 模型 训练 方法 装置 存储 介质 电子设备 | ||
本发明提供了一种反欺诈预测模型的训练方法及装置、存储介质及电子设备,该方法包括:获取各个原始样本数据;确定每个原始样本数据中缺失的特征数据的数量;基于各个原始样本数据中缺失的特征数据的数量构造每个原始样本数据的缺失值特征,并基于每个原始样本数据中的目标特征数据构造每个原始样本数据的计数特征以及排序特征;目标特征数据为数值类型的特征数据;将每个原始样本数据的缺失值特征、计数特征以及所述排序特征添加至该原始样本数据中,获得该原始样本数据对应的目标样本数据;应用各个目标样本数据构建反欺诈预测模型。能够保留样本数据的数据特征,从而提升模型的质量,能够有效的避免模型的反欺诈预测结果不准确。
技术领域
本发明涉及数据处理技术领域,特别涉及一种反欺诈预测模型的训练方法及装置、存储介质及电子设备。
背景技术
随着科学技术的快速发展,基于互联网的交易业务也越来越多,各类的欺诈交易也层出不穷,为了保障交易业务的安全性,需要进行欺诈交易检测。在欺诈交易检测过程中,通过会利用机器学习模型基于交易的业务数据对交易进行欺诈检测,从而保障交易安全。
目前,现有的机器学习模型在训练过程中,往往需要对业务数据进行特征工程处理,然而,通过现有的特征工程处理方式进行处理,往往会因为业务数据的特征数据缺失等因素,无法准确的描述业务数据的数据特性与机器学习模型的输出结果之间的关系,造成机器学习模型的反欺诈预测结果不准确。
发明内容
本发明所要解决的技术问题是提供一种反欺诈预测模型的训练方法,能够避免机器学习模型的反欺诈预测结果不准确。
本发明还提供了一种反欺诈预测模型的训练装置,用以保证上述方法在实际中的实现及应用。
一种反欺诈预测模型的训练方法,包括:
获取各个原始样本数据;
确定每个所述原始样本数据中缺失的特征数据的数量;
基于各个所述原始样本数据中缺失的特征数据的数量构造每个所述原始样本数据的缺失值特征,并基于每个所述原始样本数据中的目标特征数据构造每个所述原始样本数据的计数特征以及排序特征;所述目标特征数据为数值类型的特征数据;
将每个所述原始样本数据的所述缺失值特征、所述计数特征以及所述排序特征添加至该原始样本数据中,获得该原始样本数据对应的目标样本数据;
应用各个所述目标样本数据构建反欺诈预测模型。
上述的方法,可选的,所述应用各个所述目标样本数据构建反欺诈预测模型,包括:
对各个所述目标样本数据进行划分,获得多个第一目标样本数据、多个第二目标样本数据以及多个第三目标样本数据;
为每个所述第一目标样本数据以及每个所述第二目标样本数据设置样本标签;
将各个所述第一目标样本数据以及每个所述第一目标样本数据的样本标签组成训练样本集;
将各个所述第二目标样本数据以及每个所述第二目标样本数据的样本标签组成测试样本集;
将各个所述第三目标样本数据组成当前的未打标数据集;
应用所述训练样本集中的各个所述第一目标样本数据以及每个所述第一目标样本数据的样本标签,构建第一反欺诈预测模型;
应用所述测试样本集对所述第一反欺诈预测模型进行测试,获得所述第一反欺诈预测模型的模型评分;
应用所述第一反欺诈预测模型对当前所述未打标数据集中的各个第三目标样本数据进行预测,获得每个所述第三目标样本数据的预测得分;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银行股份有限公司,未经中国银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110690104.X/2.html,转载请声明来源钻瓜专利网。