[发明专利]一种用于异常金融账号检测的金融时间序列分类方法及应用在审
申请号: | 202010638794.X | 申请日: | 2020-07-06 |
公开(公告)号: | CN111797177A | 公开(公告)日: | 2020-10-20 |
发明(设计)人: | 施莹;王巍;王佰玲;李斌;辛国栋;黄俊恒 | 申请(专利权)人: | 哈尔滨工业大学(威海);威海天之卫网络空间安全科技有限公司 |
主分类号: | G06F16/28 | 分类号: | G06F16/28;G06F16/2458;G06N3/04;G06N3/08 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 颜洪岭 |
地址: | 264209 山*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 异常 金融 账号 检测 时间 序列 分类 方法 应用 | ||
1.一种用于异常金融账号检测的金融时间序列分类方法,其特征在于,包括以下步骤:
步骤一、金融时间序列分类的数据集构建:
基于原始数据构建数据集,原始数据包括异常金融账户和正常金融账户的交易流水数据,数据集有如下定义;
(1)CB={(C1,Y1),...,(Ci,Yi),...,(Cn,Yn)},1≤i≤n
CB表示n个交易账卡号与之对应的标签,Yi取值为0或1,其中1表示异常金融账号,0表示正常金融账号,Ci表示交易卡账号;
(2)
Mi表示交易账卡号Ci所有的交易流水数据按照交易时间进行排序后得到的原始金融时间序列,其中li为交易账卡号Ci的金融时间序列长度,Xj表示交易账卡号Ci按照时间排列后的第j条金融交易记录信息;
(3)D0={(M1,Y1),...,(Mi,Yi),...,(Mn,Yn)},1≤i≤n
D0表示n个原始金融时间序列Mi与之相应的标签,其中(Mi,Yi)表示交易账卡号Ci的原始金融时间序列Mi和标签;
(4)对D0中的每一个(Mi,Yi)都进行如下处理,得到多个等长的金融时间序列:
对交易账卡号Ci的原始金融时间序列Mi,假设新的金融时间序列的长度取ws,若li>ws,则产生li-ws+1个子序列,如下所示:
其中Sk:r=[Xk,...,Xr],1≤k≤li-ws+1,ws≤r≤li
令子序列的标签与原始金融时间序列Mi的标签一致都为Yi,因此由交易账卡号Ci的交易流水数据可以得到如下数据集:
因此,生成的新的数据集为
Dtrain=D1∪...∪Di∪...∪Dn,1≤i≤n
步骤二、金融时间序列分类模型设计:
(1)将步骤一处理后的具有固定长度的金融时间序列[Xk,...,Xr],作为输入数据送入由N个堆叠且完全相同的Block组成的特征提取模块提取全局与局部的特征信息;
Block包含三个不同的网络层次:底层的LocalBiLSTM网络、中间层的Self-Attention网络及上层的FFN网络,上下层之间通过残差连接和Layer Normalization操作连接;
LocalBiLSTM从原始输入的金融时间长序列中得到多个金融时间短序列,并且在各个金融时间短序列中独立运用BiLSTM进行处理来捕获金融时间短序列中的顺序信息以及潜在的模式信息,最后每个金融时间短序列都能够获取到一个序列结构的信息表示;当原始输入的金融时间长序列长度为n、窗口大小为m时,首先在序列前端填充m–1个元素,此时完整的金融时间长序列为[x-m+2,...,xn];此时,第t个窗口内的序列元素为[xt-m+1,...,xt],则该窗口所包含的序列表示为
ht=BiLSTM(xt-m+1,...,xt)
最后LocalBiLSTM层的输出为包含原始输入的金融时间长序列局部信息的序列,其表示为
h1,...,hn=LocalBiLSTM(x1,...,xn)
在Self-Attention层中,输入序列的每个序列元素和所有序列元素都要计算attention,所以无论序列元素之间的距离有多远,最大的路径长度也都是1,因此可以捕获到长距离依赖关系,从而得到更好的全局的模式信息;对于输入[h1,...,hn],第t个输出表示为
ut=Self-Attention(h1,...,hn)
Self-Attention的计算方式如下:
qt=ht*WQ
kt=ht*WK
vt=ht*WV
其中,αt,1,…,αt,n为h1,…,hn对于ht的注意力权重值;
在从Self-Attention层获得每个位置的精确表示之后,再在上层添加前馈神经网络FFN,FFN层的网络定义如下:
FFN(ut)=ReLU(utW1+b1)W2+b2
因此对Block可定义如下:
h1,…,hn=LocalBiLSTM(x1,…,xn)
h1,...,hn=LayerNorm(h1+x1,...,hn+xn)
u1,...,un=Self-Attention(h1,...,hn)
u1,...,un=LayerNorm(h1+u1,...,hn+un)
m1,...,mn=FFN(u1,...,un)
x1,...,xn=LayerNorm(m1+u1,...,mn+un);
(2)将最后一个Block的输出数据送入线性层,通过线性层来综合经过多级Block抽象的具有区分能力的特征信息,线性层的输出长度为2;
(3)最后使用softmax分类器来计算该金融时间序列属于异常金融账号序列和正常金融账号序列的概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(威海);威海天之卫网络空间安全科技有限公司,未经哈尔滨工业大学(威海);威海天之卫网络空间安全科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010638794.X/1.html,转载请声明来源钻瓜专利网。