[发明专利]模型训练方法、欺诈交易识别方法、装置和计算机设备在审

专利信息
申请号: 202111486921.X 申请日: 2021-12-07
公开(公告)号: CN114140246A 公开(公告)日: 2022-03-04
发明(设计)人: 尚天顺;苏越;雷声渊;王蕊 申请(专利权)人: 中国工商银行股份有限公司
主分类号: G06Q40/04 分类号: G06Q40/04;G06K9/62
代理公司: 华进联合专利商标代理有限公司 44224 代理人: 罗平
地址: 100140 北*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 模型 训练 方法 欺诈 交易 识别 装置 计算机 设备
【说明书】:

本申请涉及一种模型训练方法、装置、计算机设备、存储介质和计算机程序产品。可用于金融领域中,欺诈交易检测模型的训练,也可用于除金融领域之外的任意领域,例如大数据领域。所述方法包括:确定目标模型的原始训练样本集,根据原始训练样本集确定多数类样本集和少数类样本集;对多数类样本集进行样本划分,获得多个子样本集,对多个子样本集中每一子样本集进行聚类处理,获得每一子样本集对应的聚类样本;根据每一子样本集对应的聚类样本以及少数类样本集构建每一子样本集对应的平衡样本集,对每一子样本集对应的平衡样本集进行训练,获得目标模型。采用本方法对模型进行训练可以解决数据集中数据不平衡的问题。

技术领域

本申请涉及金融领域,特别是涉及一种模型训练方法、欺诈交易识别方法、装置和计算机设备。

背景技术

信用卡的普及,方便了商家和用户,同时也导致了大量的交易欺诈案件。近年来,随着信用卡欺诈案件的频发以及信用卡欺诈损失的增加,出现了信用卡欺诈检测模型,用于检测出信用卡交易数据集中的欺诈交易数据。

目前的信用卡欺诈检测系统往往采用信用卡欺诈检测模型识别欺诈交易数据,该模型的训练过程包括将数据集划分为训练数据集和测试数据集,并对划分好的训练集进行训练得到相应的分类器,作为信用卡欺诈检测模型。

但是训练集存在数据不平衡的问题,即训练数据集中的欺诈交易数据占极小部分,而正常交易数据占绝大部分,例如,欺诈交易数据仅为训练数据集的0.17%,基于训练数据集进行模型训练所得的信用卡欺诈检测模型往往存在准确率偏低的问题,从而会导致信用卡欺诈检测系统的检测结果准确率较低。

发明内容

本申请提供一种模型训练方法、欺诈交易识别方法、装置和计算机设备,能够解决模型训练过程中数据不平衡的问题,从而对欺诈交易进行准确的识别。

第一方面,本申请提供了一种模型训练方法。该方法包括:

确定目标模型的原始训练样本集,根据原始训练样本集确定多数类样本集和少数类样本集;

对多数类样本集进行样本划分,获得多个子样本集,对多个子样本集中每一子样本集进行聚类处理,获得每一子样本集对应的聚类样本;

根据每一子样本集对应的聚类样本以及少数类样本集构建每一子样本集对应的平衡样本集,对每一子样本集对应的平衡样本集进行训练,获得目标模型。

在其中一个实施例中,根据原始训练样本集确定多数类样本集和少数类样本集,包括:确定原始训练样本集中每一样本的数据特性;若样本的数据特性为正常交易数据,则将样本归为多数类样本集;若样本的数据特性为欺诈交易数据,则将样本归为少数类样本集。

在其中一个实施例中,对多数类样本集进行样本划分,获得多个子样本集,包括:对多数类样本集执行子样本集划分操作;子样本集划分操作包括对多数类样本集进行随机不放回抽样,基于抽出样本构建子样本集;若当前子样本集中的样本数量满足预设值,则重复执行子样本集划分操作,直至多数类样本集中的所有样本被抽出。

在其中一个实施例中,对多个子样本集中每一子样本集进行聚类处理,获得每一子样本集对应的聚类样本,包括:基于数据相似性对子样本集中的数据进行聚类,获得子样本集的聚类中心数据以及聚类中心数据的近邻数据;根据聚类中心数据以及近邻数据构建子样本集对应的聚类样本。

在其中一个实施例中,对每一子样本集对应的平衡样本集进行训练,获得目标模型,包括:对每一子样本集对应的平衡样本集进行训练,获得多个分类器;将多个分类器中模型性能评估结果最佳的分类器,确定为目标模型。

在其中一个实施例中,模型训练方法还包括:获取交易数据,将交易数据输入目标模型,根据目标模型的输出确定交易数据是否为欺诈交易数据。

第二方面,本申请还提供了一种欺诈交易识别方法。该方法包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国工商银行股份有限公司,未经中国工商银行股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111486921.X/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top