[发明专利]一种基于距离突变值的自适应欺诈异常检测方法及装置在审
申请号: | 202110729369.6 | 申请日: | 2021-06-29 |
公开(公告)号: | CN113657979A | 公开(公告)日: | 2021-11-16 |
发明(设计)人: | 李一诺;田春霖;蒋泽锟;严宋扬 | 申请(专利权)人: | 西安深信科创信息技术有限公司 |
主分类号: | G06Q40/00 | 分类号: | G06Q40/00;G06K9/62 |
代理公司: | 西安嘉思特知识产权代理事务所(普通合伙) 61230 | 代理人: | 王海栋 |
地址: | 710000 陕西省西安市高新区鱼*** | 国省代码: | 陕西;61 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 距离 突变 自适应 欺诈 异常 检测 方法 装置 | ||
1.一种基于距离突变值的自适应欺诈异常检测方法,其特征在于,包括:
从金融网络环境中获取数据组成数据集;
针对数据集中每个数据,计算该数据与其他数据之间的欧几里得距离;
使用所述欧几里得距离构建数据集的距离邻接矩阵;
在所述距离邻接矩阵查找距离值最大的元素;
针对所述距离邻接矩阵中的每个元素,计算该元素与距离值最大的元素之间的权重;
按照元素在距离邻接矩阵中的原位置,将所述权重组成距离权重邻接矩阵;
将所述距离权重邻接矩阵高于权重阈值的元素置0;
其中,所述权重阈值通过统计距离权重出现频次与权重之间的关系确定得到;
统计置零之后的距离权重邻接矩阵中每一行的为0元素数量;
在所述置零之后的距离权重邻接矩阵中确定为0元素数量大于平均值数量的行,将该行所表示的数据确定为异常数据。
2.根据权利要求1所述的自适应欺诈异常检测方法,其特征在于,所述针对数据集中每个数据,计算该数据与其他数据之间的欧几里得距离包括:
针对数据集中每个数据,使用欧几里得距离计算公式,计算该数据与其他数据之间的欧几里得距离;
欧几里得距离计算公式为:
其中,d为数据(x1,y1)与数据(x2,y2)之间的欧几里得距离。
3.根据权利要求1所述的自适应欺诈异常检测方法,其特征在于,所述使用所述欧几里得距离构建数据集的距离邻接矩阵包括:
构建行以及列与数据集中的数据个数相同的空白矩阵;
将每个数据与该空白矩阵的行以及列一一对应;
针对每个数据,将该数据与自身的欧几里得距离填入该数据行列对应的元素位置,将与其他数据之间的欧几里得距离依次填入该数据对应的行,获得距离邻接矩阵。
4.根据权利要求1所述的自适应欺诈异常检测方法,其特征在于,所述针对所述距离邻接矩阵中的每个元素,计算该元素与距离值最大的元素之间的权重包括:
针对所述距离邻接矩阵中的每个元素,按照权重公式,计算该元素与距离值最大的元素之间的权重;
所述权重公式为:w=ceil(dmax-d)
其中,w表示权重,dmax表示距离值最大的元素,d表示每个元素。
5.根据权利要求1所述的自适应欺诈异常检测方法,其特征在于,所述权重阈值通过如下步骤获得:
统计距离权重邻接矩阵中每个距离权重的出现频次;
构建距离权重与出现频次之间的偏态泊松分布图;
在所述偏态泊松分布图种确定距离权重出现频次的突变点;
将所述突变点对应的距离权重确定为权重阈值。
6.根据权利要求1所述的自适应欺诈异常检测方法,其特征在于,所述平均值数量通过如下步骤获得:
将每一行的为0元素数量求取平均值,获得平均值数量。
7.一种基于距离突变值的自适应欺诈异常检测装置,其特征在于,包括:
获取模块,用于从金融网络环境中获取数据组成数据集;
距离计算模块,用于针对数据集中每个数据,计算该数据与其他数据之间的欧几里得距离;
构建模块,用于使用所述欧几里得距离构建数据集的距离邻接矩阵;
查找模块,用于在所述距离邻接矩阵查找距离值最大的元素;
权重计算模块,用于针对所述距离邻接矩阵中的每个元素,计算该元素与距离值最大的元素之间的权重;
组成模块,用于按照元素在距离邻接矩阵中的原位置,将所述权重组成距离权重邻接矩阵;
重置模块,用于将所述距离权重邻接矩阵高于权重阈值的元素置0;
统计模块,用于统计置零之后的距离权重邻接矩阵中每一行的为0元素数量;
确定模块,用于在所述置零之后的距离权重邻接矩阵中确定为0元素数量大于平均值数量的行,将该行所表示的数据确定为异常数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安深信科创信息技术有限公司,未经西安深信科创信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110729369.6/1.html,转载请声明来源钻瓜专利网。