[发明专利]基于复杂网络的异常模式挖掘和增量式异常检测方法在审
申请号: | 202011442440.4 | 申请日: | 2020-12-08 |
公开(公告)号: | CN112527784A | 公开(公告)日: | 2021-03-19 |
发明(设计)人: | 李子煜;刘雪莉;王文俊;吴斌 | 申请(专利权)人: | 天津大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458;G06F16/26;G06Q40/02 |
代理公司: | 天津市北洋有限责任专利代理事务所 12201 | 代理人: | 程小艳 |
地址: | 300072*** | 国省代码: | 天津;12 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 复杂 网络 异常 模式 挖掘 增量 检测 方法 | ||
本发明公开基于复杂网络的异常模式挖掘和增量式异常检测方法,主要是应用于发现异常洗钱行为和非法集资行为,找出其运行的规律并进行可解释性分析;在挖掘异常账户时,可按照下面描述的步骤进行:首先我们获得银行的交易数据;对数据进行预处理;根据五元组构建转账交易网络;使用频繁模式挖掘算法挖掘正常转账模式;加入自定义异常模式定义挖掘异常转账模式;加入自定义人工经验丰富异常模式库;针对网络中不断变化的情况,使用增量式模式检测。
技术领域
本发明属于数据挖掘领域,是一种基于复杂网络的异常模式挖掘和增量式异常检测方法, 然后根据不同账户之间的转账交易关系构建交易关系网络,根据此网络挖掘交易信息中异常 洗钱和非法集资的账户。
背景技术
银行和保险公司每年因欺诈而损失数十亿美元。面对欺诈行为,银行往往会使用一些传 统的统计方法来设置用户操作的风险等级制度,或是判断一些操作是否符合常理等,来规避 一些潜在的风险因素,但是欺诈者会通过各种复杂的方法来逃避发现。由于图模式挖掘算法 有很好可解释性,且目前还未有将图模式挖掘算法应用到银行异常行为检测中。本发明通过 建立起现实世界中的“人(用户)-事(交易)”关系模型,来具体研究异常模式检测。本发 明提出一个异常账户挖掘检测框架,它为处理传统的基于数据库记录的难以分析的数据提供 了新的方法,以图模式挖掘为主导方法,异常模式检测为实际问题,研究异常模式挖掘算法 在银行交易可能产生的异常行为。将数据库中的转账交易事件表构建成网络,通过对网络的 结构和属性特征分析并挖掘异常模式进行规律分析,为商业银行异常账户判定提出指导意见。
发明内容
本发明使用图模式挖掘算法挖掘出异常模式,发现一些使用传统方法难以检测的模式, 找到发生异常的用户,并在银行现有的业务数据基础之上,通过数据挖掘技术,发现图约束 规则,建立异常模式智库。本文的最终目的即在利用银行海量数据构建的融合多元属性的银 行复杂网络的基础上,针对商业银行的异常转账行为通过异常模式挖掘和增量式异常检测, 为银行科学的制定经营策略提供具有实用性和价值性的意见,具有一定的理论意义和应用价 值。
本发明的技术方案是基于复杂网络的异常模式挖掘和增量式异常检测方法,主要是应用 于发现异常洗钱行为和非法集资行为,找出其运行的规律并进行可解释性分析;
在挖掘异常账户时,可按照下面描述的步骤进行:
第一步:首先我们获得银行的交易数据;
第二步:对数据进行预处理;
第三步:根据五元组构建转账交易网络;
第四步:使用频繁模式挖掘算法挖掘正常转账模式;
第五步:加入自定义异常模式定义挖掘异常转账模式;
第六步:加入自定义人工经验丰富异常模式库;
第七步:针对网络中不断变化的情况,使用增量式模式检测。
根据交易关系,包含以下步骤:
a.首先对银行内数据进行清洗选择,交易关系的抽取,以及交易流水与客户账户信息的对 接,最后对涉及个人隐私的私密数据要进行筛除脱密处理;
b.将某个带有标签的网络看作是一个五元组,G={V,E,ΣV,ΣE,L},其中,V表示网络 中节点的集合;表示网络中边的集合;ΣV和ΣE分别表示的是节点和边的标签的集 合;L是标签函数,V∪E→L,它的作用是完成标签向节点和边的映射,因此有:V→ΣV,E→ΣE; c.下一步我们引入数据挖掘中的支持度来计算模式的出现频率,采用基于图像的最小支持 度MNI作为评价指标,是基于单节点的支持度量,将MNI作为本算法的支持度来进行计算, 来建模数据的分布;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天津大学,未经天津大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011442440.4/2.html,转载请声明来源钻瓜专利网。