[发明专利]一种基于LSTM和逻辑斯谛回归的金融用户交易行为监控模型在审
申请号: | 202211074812.1 | 申请日: | 2022-09-02 |
公开(公告)号: | CN115409118A | 公开(公告)日: | 2022-11-29 |
发明(设计)人: | 陈平华;何思达 | 申请(专利权)人: | 广东工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08;G06Q40/04 |
代理公司: | 长沙轩荣专利代理有限公司 43235 | 代理人: | 张慧敏 |
地址: | 510000 *** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 lstm 逻辑 回归 金融 用户 交易 行为 监控 模型 | ||
1.本发明公开了一种基于LSTM和Logistic Regression的金融用户交易行为监控模型,包含以下步骤:
步骤1、数据预处理,对用户交易数据进行清洗,包括对不利于模型训练的数据中的缺失值,异常值等进行清理,同时对时间特征统一格式;
步骤2、LSTM用户交易行为检测模型训练阶段,将步骤1预处理后的交易数据输入到LSTM神经网络中进行训练;
步骤3、Logistic回归模型训练阶段,将步骤2中的输出结果作为输入,放入Logistic回归模型中进行训练;
步骤4、预测阶段,通过步骤3的分类结果进行用户交易行为的预测。
2.根据权利要求1所述的一种基于LSTM和Logistic Regression的金融用户交易行为监控模型,其特征在于,所述步骤1数据预处理的具体步骤为:
(1)获取用户的交易行为数据并进行预处理,样本特征集合Xi指用户的基本属性和交易行为等集合,即第i个样本特征集合为Xi={xi1,xi2,...,xiq},i=1,2,...,p,表示有p个样本,q个特征;对笔数,金额数据进行min-max归一化处理:
(2)样本类别Yi是指该样本数据是否存在风险交易行为,1表示存在风险交易行为,0表示正常的交易行为;即Yi={yi},yi为0-1变量;设历史交易数据为K,本次交易数据为k,那么用户交易行为检测就是根据K来确定k是否存在风险交易行为,即
k={xi1,xi2,...,xiq}
(3)由此可见,用户交易行为问题是一个不平衡的二分类问题,并且数据样本规模大,计算复杂度高,数据分布不平衡,数据与数据之间会存在序列关系。
3.根据权利要求1所述的一种基于LSTM和Logistic Regression的金融用户交易行为监控模型,其特征在于,所述步骤2中LSTM用户交易行为检测模型训练阶段具体步骤为:
(1)构建一个LSTM神经网络;鉴于CNN在特征提取方面的优势和激活函数在非线性方面的良好表达能力,以及众多经典神经网络模型在CNN+LSTM组合后的良好效果,因此在LSTM网络之前增加了三层CNN网络用于提取特征,激活函数都选择ReLU激活函数;
(2)LSTM模型通过特有的门单元∶遗忘门、输入门、输出门以及一个记忆单元保存长期记忆,记为Ct;遗忘门就是对过去的信息有选择的遗忘:
ft=σ*(Wf*[ht-1,xt]+bf),
输入门就是对新的信息有选择的遗忘:
st=σ*(Ws*[ht-1,xt]+bs),
而输出门用了一个sigmoid函数,决定输出这个时间步的哪些信息:
ht=ot*tanh(Ct),
ot=σ*(Wo*[ht-1,xt]+bo),
LSTM的状态依赖于当前输入和上一个状态,而后者又依赖于更上一步的输入和状态;其中,ft、st分别代表第t时刻的遗忘门和输入门的状态,它们是通过输入xt和上一步的隐含层输出ht-1进行线性变换,在经过激活函数σ得到;在每一个时刻,遗忘门会控制上一个时刻记忆的遗忘程度,输入门会控制新记忆的写入长期记忆的程度,由此可以得出,从上一个记忆单元的状态Ct-1到当前的状态Ct的转移不一定完全取决于激活函数计算得到的状态,还由遗忘门和输入门共同控制;ot表示第t时刻的输出门状态,它控制这着短期记忆如何受长期记忆影响。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东工业大学,未经广东工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211074812.1/1.html,转载请声明来源钻瓜专利网。