[发明专利]低频交易的个体行为建模与欺诈检测方法有效
申请号: | 202010045152.9 | 申请日: | 2020-01-16 |
公开(公告)号: | CN111242744B | 公开(公告)日: | 2022-11-11 |
发明(设计)人: | 章昭辉;蒋昌俊;王鹏伟;陈立功 | 申请(专利权)人: | 东华大学 |
主分类号: | G06Q30/06 | 分类号: | G06Q30/06 |
代理公司: | 上海申汇专利代理有限公司 31001 | 代理人: | 徐俊 |
地址: | 201600 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 低频 交易 个体 行为 建模 欺诈 检测 方法 | ||
1.一种低频交易的个体行为建模与欺诈检测方法,其特征在于,包括以下步骤:
步骤1、用户行为提取,包括以下步骤
S101:提取用户自身行为:
从历史交易数据库中提取用户u的历史正常交易数据,从多个维度对用户u的历史正常交易数据进行处理,得到用户u的自身交易行为,再通过最佳风险阈值算法确定用户的最佳风险阈值,从而构建出用户u的自身行为基准UBBu;
S102:提取当前交易群体行为:
对历史发生的全部交易进行处理,利用基于密度的聚类算法对历史正常交易和欺诈交易进行分类,得到若干类别,再分别对每一类别进行处理,得到当前若干条群体交易行为GBB;
S103:计算当前交易状态
根据历史发生的全部交易序列,提出滑动窗后机制,对交易序列进行聚合,得到历史交易状态序列,将交易状态序列中的均值作为临界值,记为历史交易状态临界值St,包括以下步骤:
S1031:提取历史全部交易:
从历史交易数据库中提取用户u截止当前日期的全部历史交易;
S1032:滑动窗口集合机制:
在t时刻的交易记为rt,在t时刻之前发生的交易序列记为Lt={r1,…,rt},设滑动窗口为h,长度为k,即nh=k,滑动窗口中交易序列记为Lht={rt-k,…,rt};
S1033:计算每一时刻的交易状态:
在t时刻的滑动窗口ht中,中提取出异常交易Fht={r∈Lht|label=fraud},其中,label表示交易的类别,fraud表示该交易属于欺诈交易;将当前时间段内交易状态记为St,表示当前时间段中前k个交易中欺诈交易占据的比例,其计算方式如下所示:
式中,
S1034:构建当前交易状态:
利用滑动窗口h对已经发生的全部交易集合进行聚合,求出每一窗口中欺诈交易的占比,得到n-nh个比值序列将比值序列的均值作为历史交易状态的一个临界值ThresholdS,若交易状态St大于这个临界值时,视St为异常状态,记为St=1,否则当前交易状态为正常状态,记St=0;
S104:构建用户u新的交易行为
用户新的交易行为由用户u的自身行为基准UBBu、当前群体交易行为GBB、历史交易状态临界值St组成,用一个三元组表示,则用户u新的交易行为New_UBBu=(UBBu,GBB,St),将其存入用户行为基准库中;
步骤2、根据行为用户u新的交易行为New_UBBu,构建针对低频用户的欺诈检测模型,包括以下步骤:
S201:数据输入
将当前待检测交易作为输入输入检测模型中;
S202:提取用户行为基准
从用户行为基准库中提取当前用户的行为基准New_UBBu,作为检测模型的输入;
S203:提取用户自身交易行为:
从用户的行为基准New_UBBu中提取用户自身交易行为基准UBBu,在其中取出用户自身交易行为TBu;
S204:提取用户最佳风险阈值:
在用户自身交易行为基准中提取该用户最佳风险阈值Thresholdu;
S205:计算用户交易结果:
根据超球体模型,将TBu作为多为空间中的一个点,将Thresholdu作为多维空间中的半径,将交易检测转化为多维空间中点的映射问题,利用以下公式去判断当前交易是否正常:
式中,xi为用户当前交易ru映射到当前多维空间中点的每一个维度值,tbi为用户自身交易行为各个维度的值,上述公式将空间划分为两个部分,f1(x)表示超球体模型的计算公式,若f1(x)0,说明当前交易不在用户正常行为空间中,记为欺诈交易,反之记为正常交易,得到用户当前交易结果URt:
S206:提取当前群体行为:
从用户行为基准库中提取当前交易群体的行为基准GBB;
S207:与当前交易进行匹配:
对于当前进入系统中的交易ru,将其转化为矩阵rT=[x1,x2,x3,x4,x5,x6],对于矩阵rT,利用公式计算该交易与正常行为TBB和异常行为FBB中每一条行为基准的偏离距离,得到以下两个距离集合DTBB和DFBB,其中DTBB=[d1,…,dq],DFBB=[d1,…,dP];之后通过公式判断当前交易偏向那种行为,若交易更偏向黑样本行为,则该交易可疑程度较高:
上述公式代表计算当前交易与TBB和FBB中每一条行为基准之前的偏离距离,式中代表当前交易转化为矩阵后的矩阵向量,代表TBB或FBB中每一条行为的行为向量,其中1≤j1≤Q,Q表示正常交易,1≤j2≤P,P表示欺诈交易;
S208:计算群体交易结果:
上公式代表当前交易倾向程度,式中为当前交易ru与异常行为的偏离程度均值,式中为当前交易ru与正常行为的偏离程度均值,两者之差为f2(x),若f2(x)过于小,说明当前交易ru与黑样本的距离更近,可疑程度增加;反之,可疑程度降低,得到用户当前ru交易结果GRt,如下式所示,其中ThresholdG则是通过最佳风险阈值算法计算出的最佳阈值:
S209:提取当前交易状态:
从用户行为基准库中提取当前交易状态St;
S210:计算历史交易状态:
利用滑动窗口h对已经发生的全部交易集合进行聚合,求出每一窗口中欺诈交易的占比,得到n-nh个比值序列
S211:得到交易状态结果:
将序列的均值作为历史交易状态的一个临界值ThresholdS,若交易状态St大于这个临界值时,视St为异常状态,记为St=1,否则当前交易状态为正常状态,记St=0;
S212:利用贝叶斯计算当前交易属于欺诈概率:
对于当前交易ru,根据用户自身行为和当前群体行为对此交易的判断结果URt和GRt,以及交易状态St,记输入x=(URt,GRt,St),对于当前输入,利用以下公式计算交易ru属于欺诈交易概率P(Y=1|X=x)和正常交易的概率P(Y=0|X=x):
若P(Y=1|X=x)P(Y=0|X=x),交易ru属于欺诈交易,否则为正常交易,式中,P(X=x|Y=1)表示当前交易为欺诈交易时X=x的概率,P(Y=1)表示当前交易为欺诈交易的概率,P(X=x|Y=k)表示当前交易类别为k,正常或欺诈,时X=x的概率,P(Y=k)表示当前交易类别为k,正常或欺诈,的概率,P(x(j)=x(j)|Y=k)表示当前交易类别为k,正常或欺诈,时X中每一项出现概率的概率,P(X=x|Y=0)表示当前交易为正常交易时X=x的概率,P(Y=0)表示当前交易为正常交易的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东华大学,未经东华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010045152.9/1.html,转载请声明来源钻瓜专利网。