[发明专利]基于动态加权信息熵的欺诈交易识别方法、系统及装置在审
申请号: | 202010436168.2 | 申请日: | 2020-05-21 |
公开(公告)号: | CN113723950A | 公开(公告)日: | 2021-11-30 |
发明(设计)人: | 蒋昌俊;闫春钢;丁志军;刘关俊;张亚英;李震川 | 申请(专利权)人: | 同济大学 |
主分类号: | G06Q20/38 | 分类号: | G06Q20/38;G06K9/62;G06N3/08 |
代理公司: | 上海光华专利事务所(普通合伙) 31219 | 代理人: | 邬嫡波 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 动态 加权 信息 欺诈 交易 识别 方法 系统 装置 | ||
本发明提供一种基于动态加权信息熵的欺诈交易识别方法、系统及装置,包括以下步骤:使用动态加权信息熵筛选one‑class‑SVM模型,选出重叠数据子集动态加权信息熵最大的one‑class‑SVM模型Mocsvm;使用one‑class‑SVM模型Mocsvm将原始数据划分为重叠数据子集和非重叠数据子集;使用one‑class‑SVM模型Mocsvm划分得到的重叠数据子集训练非线性分类器模型Mclf,使用非线性分类器模型Mclf区分重叠数据子集中的欺诈交易和正常交易;生成由one‑class‑SVM模型Mocsvm和非线性分类器模型Mclf构成的欺诈交易识别模型。本发明,采用分而治之的策略,为非线性机器学习模型排出大量易识别的正常交易数据,使得模型能仅关注于难以划分数据的学习,充分发挥了非线性模型的能力,提升欺诈交易识别模型的性能。
技术领域
本发明涉及电子欺诈交易识别技术领域,特别是涉及一种基于动态加权信息熵的欺诈交易识别方法、系统及装置。
背景技术
近年来,将金融和科技融合的金融科技成为热点研究领域之一。人工智能推动力了金融科技以提供更高质量的服务,与此同时,金融科技为人工智能研究和创新提供了广泛的平台和应用场景。电子交易欺诈检测是金融科技最重要的研究之一,已引起广泛关注。识别欺诈交易具有很大的挑战性,其中最重要的原因之一是数据不均衡问题,尤其是带有数据重叠(overlapping)的数据不均衡问题。当不同类别的数据之间的样本量差异很大时,就会发生类别不平衡,这在电子交易记录中很明显,因为欺诈交易的数量远远少于正常交易的数量。Overlapping是指不同类别的样本包含在同一数据空间区域中,这会增加分类器区分重叠区域中不同类别的样本的学习难度。由于欺诈者将不遗余力地模仿真实持卡人的交易行为以使欺诈检测系统失效,欺诈交易和合法交易将在某些数据空间区域中交织在一起,并导致overlapping问题。如果只是数据不均衡(non-overlapping非重叠)问题,即使数据不均衡比很高,也可能不会对分类器的性能带来很大的影响,因为有些分类模型的性能于不同类别样本的数量无关,例如基于最大间隔的分类模型等。但是,如果数据不均衡和overlapping问题同时出现,那么即使基于最大间隔的分类器也无法在正确地区分不同类别的样本方面取得良好的性能。
在在电子欺诈交易识别中,数据不均衡是影响欺诈交易识别模型性能的关键因素之一。而由于欺诈分子挖空心思来模仿持卡人的真实交易行为来避免被识别,从而使得真实交易与欺诈交易数据交叉,带来overlapping问题。带有overlapping的数据不均衡问题使得欺诈交易识别更加困难。
现有的研究主要是采用最近邻方法k-NN模型对原始数据集进行划分得到overlapping数据子集和non-overlapping数据子集。针对overlapping数据子集,通常采用采样方法去除其中的多数类样本,使得不同类别样本之间的边界更为清晰,对准确识别少数类样本更加有利。最后再将处理后的overlapping数据子集与non-overlapping数据子集合并为新的数据集,然后使用此新的数据集训练机器学习模型来区分不同类别的样本。这类方法存在一些明显的缺陷,首先overlapping数据子集中的部分样本被删除,虽然得到了更清晰的决策边界,但是可能会引起重要的样本信息丢失,使得决策边界出现错误。此外,overlapping数据子集由k-NN模型从原始数据中划分得到,但是k-NN模型参数的选择缺乏指导,通常是经过多次试验才能确定,需要消耗很多时间和计算资源,尤其是在有海量交易数据的欺诈交易识别场景中,k-NN模型难以适用。
因此,希望能够解决如何有效、快速识别overlapping和non-overlapping数据子集,如何加速后续非线性机器学习模型的训练过程,减少模型训练的资源消耗,如何更好的进行电子欺诈交易识别的问题。
发明内容
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010436168.2/2.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置