[发明专利]一种信用卡欺诈检测方法在审
申请号: | 202110772373.0 | 申请日: | 2021-07-08 |
公开(公告)号: | CN113706285A | 公开(公告)日: | 2021-11-26 |
发明(设计)人: | 江琼琴;宋文广;赵俊峰;陈汉林;郭国民;刘小灵;苏宏发;杨瑾;赵莉;崔艳荣;张健;余谦;雷鸣;黄岚;钟宝荣 | 申请(专利权)人: | 长江大学 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06Q20/40;G06K9/62;G06N20/00 |
代理公司: | 成都东恒知盛知识产权代理事务所(特殊普通合伙) 51304 | 代理人: | 罗江 |
地址: | 434023*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 信用卡 欺诈 检测 方法 | ||
本发明公开了一种信用卡欺诈检测方法,包括以下步骤:S1:获取训练数据集;S2:将S1获取的训练数据集进行数据探索性分析,得到数据集中各个特征的重要性和功能性,以及各个特征与其他特征之间的联系;S3:对S2处理后的特征进行提取,然后进行PCA变换,对数据进行降维;S4:对S3降维处理后的数据进行平衡;S5:采用CatBoost算法进行训练,得到CatBoost训练模型;S6:对S3降维处理后的数据采用XGBoost和/或LGBM算法进行模型训练得到XGBoost训练模型和/或LGBM训练模型;S7:将S5得到的CatBoost训练模型,以及S6得到的XGBoost训练模型和/或LGBM训练模型融合,采用加权得到最终模型;S8:通过将信用卡欺诈检测数据输入至最终模型,得到检测结果。
技术领域
本发明涉及信息安全检测技术领域,尤其是一种信用卡欺诈检测方法。
背景技术
紧随着互联网快速发展的脚步,人们的思维方式和生活方式也发生了翻天覆地的变化。人们从现金支付变成了网上支付,信用卡由于其具有能为持卡人提供支付便利,暂时缓解经济压力等优势,逐渐占领市场。由于信用卡支付是线上支付,这给人们带来了一些安全方面的困扰,主要包括三个方面:一是风险来源于持卡人,持卡人利用信用卡恶意透支;二是风险来源于商家,商家工作人员持卡离开顾客的视线,使用顾客的信用卡进行消费;三是风险来源于第三方,黑客攻击个人电脑,盗取用户信息。信用卡欺诈存在八种主要的欺诈应用场景:注册,登录,实名认证,商品浏览,下单,支付,评价和推广营销。
信用卡包含了大量的个人信息,银行业也在逐步地规避信用卡欺诈带来的风险和损失。他们使用先验知识对原始数据进行统计分析,使用逻辑回归方法去预测二项式结果,但是耗时较长。
发明内容
本发明目的在于:针对上述问题,提供一种信用卡欺诈检测方法,能够有效对信用卡欺诈进行有效检测,且检测速度快,准确度高。
本发明是通过下述方案来实现的:
一种信用卡欺诈检测方法,包括以下步骤:
S1:获取训练数据集;
S2:将S1获取的训练数据集进行数据探索性分析,得到数据集中各个特征的重要性和功能性,以及各个特征与其他特征之间的联系;
S3:对S2处理后的特征进行提取,然后进行PCA变换,对数据进行降维;
S4:对S3降维处理后的数据进行平衡;
S5:采用CatBoost算法进行训练,得到CatBoost训练模型;
S6:对S3降维处理后的数据采用XGBoost和/或LGBM算法进行模型训练得到XGBoost训练模型和/或LGBM训练模型;
S7:将S5得到的CatBoost训练模型,以及S6得到的XGBoost训练模型和/或LGBM训练模型融合,采用加权得到最终模型;
S8:通过将信用卡欺诈检测数据输入至最终模型,得到检测结果。
作为一种优选方案,S4过程中,采用maha-smote算法平衡数据,具体包括以下步骤:
K1:对于少数类中每一个样本x,计算它的近邻的欧几里得距离,按照从小到大的顺序排序,将前k个近邻合并为k近邻集合;
K2:根据多数类和少数类样本的不平衡比例设置上采样倍率N,对于每一个少数类样本x,从其k近邻集合中随机选择几个样本,得到近邻样本为xn;
K3:对于每一个选出的近邻样本xn,计算器马氏距离mahal(xn),以及中心元素的马氏距离mahal(x);
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长江大学,未经长江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110772373.0/2.html,转载请声明来源钻瓜专利网。