[发明专利]一种基于多阶段数据表征的网络借贷欺诈预测方法在审
| 申请号: | 202210111445.1 | 申请日: | 2022-01-29 |
| 公开(公告)号: | CN114387092A | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 王成;朱航宇 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06F40/30;G06F40/295 |
| 代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 叶凤 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 阶段 数据 表征 网络 借贷 欺诈 预测 方法 | ||
1.一种基于多阶段数据表征的网络借贷欺诈预测方法,其特征在于,分为四个步骤:
步骤S101,关联表征:
根据原始网络借贷申请数据中字段缺失率选定可用字段,基于所述字段构建原始信息网络,然后将所述原始信息网络中的节点划分为实体和属性,构建由实体层和属性层组成的分层信息网络;提供给S102和S103;
其中,缺失率是指在原始网络借贷数据集中一个字段缺失的次数与总借贷事务数量的比值;
步骤S102,属性表征:
从所述分层信息网络中的属性层中提取一个属性网络,给每个属性附加一个预训练的词向量来反映属性之间的语义相似性,利用网络表征学习将从先验和外部语义知识中获取的属性相似信息和属性共现关联融入属性对应的嵌入向量中;提供给S103;
步骤S103,实体表征:
从所述分层信息网络中实体层抽取实体网络,利用层对应关联和步骤S102中得到的嵌入向量,生成带属性的实体网络,采用网络表征学习将带属性的实体网络嵌入到低维向量空间得到实体的嵌入向量;提供给S104;
步骤S104,欺诈预测:
在带属性的实体网络中引入实体与其一阶邻居(实体)的相似性作为微观特征,采用借贷申请交易与属于实体网络中的二阶邻居之间的相似性作为宏观特征,将不同实体的嵌入向量的相似性喂入常见分类器模型实现欺诈预测功能。
2.如权利要求1所述一种基于多阶段数据表征的网络借贷欺诈预测方法,其特征在于,所述步骤S101,其过程如下:
获取原始网络借贷申请数据,基于测试需求设置训练集时间窗口和测试集时间窗口,以用于在原始网络借贷申请数据中划分出训练集数据和测试集数据,使得训练集数据和测试集数据构成可用于后续模型的网络借贷数据;
对原始网络借贷数据进行字段选择;
对所述选定的初始网络借贷数据的字段进行关联抽取,采用图结构描述网络借贷数据之间的关联,对所述的原始网络借贷数据中一笔申请的所选择的字段,使用星形拓扑结构构建原始信息网络:将其标识符和所有字段的取值表示为节点,将标识符和相应字段取值分别记为组成边的两个节点,不同的借贷申请标识符通过其共享的字段连接;
将所述原始信息网络中的节点划分为实体和属性;
实体集合V分为Vt和Vd两个部分,对于每一笔借贷申请,将其标识符记为vt∈Vt,将所述申请中的其他实体记为vd∈Vd;实体vd和标识符vt的共现关联被记为e=(vt,vd,r)∈E,其中类型r∈R(R为对原始数据中所有实体的描述的集合)为原始数据中对于实体vd的描述,集合
所有属性θv的集合Θ记为分层信息网络中的属性层;
从借贷申请中提取出实体和属性的对应关联,在所述原始信息网络中,属性θv和实体vd都连接到实体vt,将属性θv和实体vd之间的公共连接记为层对应关联(vd,θv),即实体和属性的对应关联;
在所述属性层中,将每个实体v∈V的对应的属性记为其中i表示属性的类型,通过对所述原始信息网络的处理,可以得到实体层、属性层和层对应关联,进而由实体层和属性层两层以及层对应关联构建一个分层信息网络。
3.如权利要求2所述一种基于多阶段数据表征的网络借贷欺诈预测方法,其特征在于,对原始网络借贷数据进行字段选择时,选取缺失率低于50%的字段作为可用字段。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210111445.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:拍摄方法、装置和电子设备
- 下一篇:一种新能源节能环保燃烧炉
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





