[发明专利]基于随机森林模型的金融交易检测方法和设备在审
申请号: | 201410361193.3 | 申请日: | 2014-07-25 |
公开(公告)号: | CN105279691A | 公开(公告)日: | 2016-01-27 |
发明(设计)人: | 赵金涛;邱雪涛;杨鸿超;王骏 | 申请(专利权)人: | 中国银联股份有限公司 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00 |
代理公司: | 中国专利代理(香港)有限公司 72001 | 代理人: | 俞华梁;汤春龙 |
地址: | 200135 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 随机 森林 模型 金融交易 检测 方法 设备 | ||
1.一种基于随机森林模型的金融交易检测方法,包括:
(a)获得历史交易表和欺诈交易表;
(b)利用所述历史交易表和所述欺诈交易表来构造样本数据集合,所述样本数据集合包括样本特征变量;
(c)从所述样本数据集合中随机有放回地抽取多份样本;
(d)为所述多份样本中的每一份样本随机选择相同数量的特征变量,以便生成与该份样本对应的决策树模型,进而生成随机森林模型;
(e)对所述随机森林模型中的多个决策树模型的每一个进行训练并进行评估,以便获得每个决策树模型的准确率;
(f)基于所述准确率来确定每个决策树模型的投票权重qi;以及
(g)利用所述随机森林模型中的多个决策树模型对所输入的金融交易数据的响应输出yi以及所述投票权重qi,根据如下公式来获得投票结果RF并判定所述金融交易是否存在欺诈:
其中,l为决策树模型的数量。
2.如权利要求1所述的方法,还包括:
(h)在判定所述金融交易存在欺诈时,将所述交易加入欺诈侦测结果集中;
(i)对所述欺诈侦测结果集中的交易进行确认,并将确认为欺诈的交易加入所述欺诈交易表中;以及
(j)重新执行步骤(a)和(b)。
3.如权利要求1所述的方法,其中,步骤(e)进一步包括:
(e1)计算训练样本中所有变量在所有取值上划分的基尼系数;
(e2)取基尼系数最小的划分为第一最佳分裂点;以及
(e3)基于所述第一最佳分裂点将所述训练样本进行划分,并对划分后的训练样本分别重复执行(e1)和(e2)以便确定第二最佳分裂点。
4.如权利要求1所述的方法,其中,所述样本特征变量包括原始变量、上下文变量和统计变量。
5.如权利要求4所述的方法,其中,所述原始变量是从所述欺诈交易表和所述历史交易表中直接获取的交易金额和交易时间。
6.如权利要求4所述的方法,其中,所述上下文变量是交易是否在同一地区和交易是否在同一商户。
7.如权利要求4所述的方法,其中,所述统计变量是某卡号或该卡号交易商户在一段时间内的统计信息。
8.如权利要求1所述的方法,其中,所选择的特征变量的数量为n,并且n与特征变量的总数N的关系如下:
9.如权利要求1所述的方法,其中,当某决策树模型的准确率低于一阈值时,从所述随机森林模型中舍弃该决策树模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国银联股份有限公司,未经中国银联股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410361193.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:用于嵌套式有限合伙企业资产在线交易的管理装置
- 下一篇:租车的方法和系统