[发明专利]一种基于异构金融特征的异常交易识别方法,设备及存储介质有效
申请号: | 201810909350.8 | 申请日: | 2018-08-10 |
公开(公告)号: | CN108960833B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 李晓颖;吕芳;王佰玲;王巍;黄俊恒;辛国栋 | 申请(专利权)人: | 哈尔滨工业大学(威海) |
主分类号: | G06Q20/38 | 分类号: | G06Q20/38;G06Q40/04 |
代理公司: | 山东舜源联合知识产权代理有限公司 37359 | 代理人: | 张亮 |
地址: | 264209 山东省威海市哈*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 金融 特征 异常 交易 识别 方法 设备 存储 介质 | ||
1.一种基于异构金融特征的异常交易识别方法,其特征在于,方法包括:
步骤一,对输入的原始金融交易流水数据集,进行数据预处理;数据预处理方式为数据清洗和数据格式归一化处理,以及关键项数据提取,得到关键项数据集合D;构建信息数据集Dtp和账号信息数据集Dc;
提取交易流水中的交易卡号、交易日期、交易金额、摘要说明以及对手账号关键信息项;将交易卡号作为用户的身份标识,交易账号默认为用户交易卡号;基于关键项信息数据集进行数据清洗和格式归一化操作,将带有“进出”标志位的交易金额数据转换成带有正负号的数值,‘进’为正数,‘出’为负数;清洗掉交易金融项绝对值小于50的交易流水数据与交易卡号为空的数据;然后将交易日期按“YYYYMMDDhhmmss”格式进行归一化处理;
经过数据清洗和格式归一化操作后,基于关键项信息数据集,分别构建交易对信息数据集和账号信息数据集;
步骤二,基于交易对信息据集Dtp,构建交易熵特征向量数据集合DtpH;
步骤二中交易熵特征向量的获取步骤如下:
1)按照列表元素的time项中月日类别对该列表元素进行集合划分,得k为中出现的月日类别数,清洗掉Dtp数据集中k值小于2的ltp数据;
2)接步骤1),基于MDi,在计算H(attr)时,pattri中的TF(attri)计算时只考虑属性值attri在列表中出现的概率,即只可以使用mdj之前的md列表的交易,而当前及之后的交易都不考虑在内,j=2,...,k;将当前月日交易列表mdj加入到H(attr)的计算中获得目前的熵newH(attr);则定义差值熵attrHj为:
attrHj=H(attr)-newH(attr)
3)假设不同属性的概率分布是相互独立的,此时有联合熵H(X,Y)=H(X)+H(Y)成立;则,对attr∈{time,money,summary},定义交易熵tranHj为这3个属性差值熵的联合熵,即:
tranHj=timeHj+moneyHj+summaryHj
4)针对交易流水序列,根据步骤1)和步骤2)计算交易熵tranHj,由j=1开始,然后j=j+1,直到j=k结束,取tranH0=tranH1=0;
5)经过步骤3),得到TranHi=(tranH1,...,tranHk),TranHi即为交易对tpi的交易流水序列对应的交易熵初始特征;
6)针对步骤5)所得的TranHi,采用长度为10、步长为5的滑窗对tranH由前向后进行数据分割;TranHi长度大于10时,若最后一个滑窗包含的数据长度不足10但大于2,则进行补0操作;否则,舍弃此部分数据;TranHi长度小于10时,进行补0操作;生成有即属于tpi的交易熵特征向量集合;
7)接步骤6),由构建交易熵特征向量数据集DtpH,交易对tpi对应交易熵特征向量集合元素指定编码ID后重构数据中,交易熵特征向量由交易对tpi和编号j共同标识;
步骤三,基于交易熵特征向量数据集DtpH和账号信息数据集Dc,构建数据集的异构金融特征向量集DtpISO;
其中交易对tpi操作高频月份和操作高频日交易金额统计特征计算步骤如下:
1)根据账号信息数据集构建方法得,账号信息数据集其中n为卡号总数,若则这里j仅表示列表中某个元素的下标;
2)根据步骤1),分别计算交易对tpi中交易账号ci和交易对手账号ci%对应的交易流水列表中交易数最多的月份和日,作为交易对的高频交易月topm和高频交易日topd,然后获取高频交易月、日对应的交易金额项子列表
3)分别计算交易对tpi交易金额项子列表中的金额统计特征中位数me、众数mo、平均数ave、标准差std,得到交易对tpi对应的金额统计特征向量
步骤四,基于异构金融特征向量数据集DtpISO,构建训练集Train,以及分别构建三种基分类器模型,然后构建最终的VoteClassifierModel投票分类器预测模型;
步骤五,账号检测识别,对于待检测金融交易流水信息数据集根据步骤一进行预处理操作,得到预处理操作结果关键项数据集Dtest,进而提取出交易对信息数据集和账号信息数据集构建交易熵特征向量数据集基于步骤三,基于和数据,计算多维异构特征值,构建异构金融特征向量数据集将输入构建好的VoteClassifierModel投票分类器模型中,进行分类预测,得到最终检测识别结果即对应交易对为传销交易关系的异常概率。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工业大学(威海),未经哈尔滨工业大学(威海)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810909350.8/1.html,转载请声明来源钻瓜专利网。
- 上一篇:区块链实名通信的隐私保护方法和系统
- 下一篇:金融业务鉴权方法和系统