[发明专利]一种基于多阶段数据表征的网络借贷欺诈预测方法在审
| 申请号: | 202210111445.1 | 申请日: | 2022-01-29 |
| 公开(公告)号: | CN114387092A | 公开(公告)日: | 2022-04-22 |
| 发明(设计)人: | 王成;朱航宇 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62;G06F40/30;G06F40/295 |
| 代理公司: | 上海科律专利代理事务所(特殊普通合伙) 31290 | 代理人: | 叶凤 |
| 地址: | 200092 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 阶段 数据 表征 网络 借贷 欺诈 预测 方法 | ||
本发明属于网络借贷欺诈预测技术领域,公开了一种基于多阶段数据表征的网络借贷欺诈预测方法,包括以下步骤:步骤S101:根据原始网络借贷申请数据选定可用字段构建原始信息网络,然后将节点划分为实体和属性,构建由实体层和属性层组成的分层信息网络;步骤S102:从属性层中提取一个属性网络,给每个属性附加一个预训练的词向量来反映属性之间的语义相似性,利用网络表征学习将从先验和外部语义知识中获取的属性相似信息和属性共现关联融入属性对应的嵌入向量中;步骤S103,实体表征;步骤S104,欺诈预测。本发明增强了网络借贷申请事务中信息关联的密度,提高了网络借贷欺诈预测模型的检测能力,对保护用户和企业的资金安全有更好的保障。
技术领域
本发明涉及网络借贷欺诈预测技术领域,尤其涉及一种基于多阶段数据表征的网络借贷 欺诈预测方法。
背景技术
目前随着互联网业务的日益扩大,借贷也随之进入新的发展阶段,互联网为借贷带来了 便利,降低了借贷的门槛,实现了小额贷款的大量增加。然而互联网环境的复杂性和网络借 贷的低门槛性增大了网络借贷发生欺诈的可能性,网络借贷的欺诈行为往往会给企业和社会 带来不可控的巨额损失,造成结构性风险。为了保障互联网场景下网络借贷系统的业务安全, 需要建立切实有效网络借贷欺诈预测方法。
传统的网络借贷反欺诈技术如黑白名单和业务规则等作为网络借贷反欺诈安全防线的第 一道防线,既难以面临互联网场景下欺诈技术的快速进化,也不足以完全覆盖整个网络借贷 的目标用户群体。因此,基于数字驱动范式的机器学习反欺诈技术可以作为第二道安全防线 对网络借贷反欺诈安全防护领域进行补充。
目前,数据驱动范式是数字金融反欺诈任务的有效解决方案,相关工作已经被广泛研究, 机器学习算法有助于实现更好的网络借贷反欺诈已经成为业界共识。例如,Liang等人在ACM SIGIR 2019会议上提出一种基于图学习算法的自动欺诈检测解决方案,将诈骗犯从老客户中 分离出来,并发现有组织的诈骗犯。此外一部分研究人员进一步成功地结合机器学习技术和 网络表征学习技术,如图神经网络,对挖掘隐藏在申请人数据中的深层关联。然而,当前网 络借贷数据的规模往往很大,但是欺诈数据隐藏在海量的正常数据中,这个给网络借贷反欺 诈预测带来了巨大的挑战。由于数据是受限的,用于欺诈预测的有用信息通常不足,仅仅依 靠低信息密度的申请信息难以建立数据驱动范式模型。
通过以上研究发现,面向网络借贷反欺诈预测的一个主要问题可以归结为申请信息的信 息密度太低以至于数据无法直接应用于网络借贷欺诈预测任务。现有的一些相关工作直接对 完整的原始信息的载体进行操作,以充分保存有用信息,由于有用信息被埋在大量无用信息 中,通常效果不佳。另一部分工作通过丢弃部分信息来减小信息载体的规模,克服无用信息 的影响,这导致信息的不完整,通常会大大降低欺诈预测的性能。
发明内容
本发明目的在于克服现有技术的不足,提出了一种基于网络表征学习的多阶段数据表征 方法,作为提升信息密度的增强器,同时通过增加有用信息和减少信息载体两种策略来提高 信息密度,实现数据的增强,改善机器学习模型的反欺诈能力。
本发明所要解决的技术问题是网络借贷反欺诈场景下传统的欺诈预测方法,难以应对关 联稀疏的借贷数据,无法捕捉借贷申请之间的深度关联。因此仅利用基本的申请信息,难以 构建高效的反欺诈模型,并缺乏较好的泛化能力。
为了解决上述技术问题,本发明技术方案为:
一种基于多阶段数据表征的网络借贷欺诈预测方法,其特征在于,分为四个步骤:
步骤S101,关联表征:
根据原始网络借贷申请数据中字段缺失率选定可用字段,基于所述字段构建原始信息网 络,然后将所述原始信息网络中的节点划分为实体和属性,构建由实体层和属性层组成的分 层信息网络;提供给S102和S103;
其中,缺失率是指在原始网络借贷数据集中一个字段缺失的次数与总借贷事务数量的比 值;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210111445.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:拍摄方法、装置和电子设备
- 下一篇:一种新能源节能环保燃烧炉
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置





