[发明专利]一种基于时序神经网络模型的欺诈用户检测系统在审
申请号: | 202010030012.4 | 申请日: | 2020-01-10 |
公开(公告)号: | CN113129028A | 公开(公告)日: | 2021-07-16 |
发明(设计)人: | 李龙;刘殿中 | 申请(专利权)人: | 联洋国融(北京)科技有限公司 |
主分类号: | G06Q30/00 | 分类号: | G06Q30/00;G06K9/62;G06N3/04 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100032 北京市西城区北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时序 神经网络 模型 欺诈 用户 检测 系统 | ||
本发明公开了一种基于时序神经网络模型的欺诈用户检测系统,包括:处理模块,用于面向用户上网行为的数据处理;提取模块,基于历史通话行为数据的特征提取;检测模块,基于时序神经网络模型的欺诈用户检测;修正模块,用于欺诈用户检测及修正。本发明的有益效果为:本发明考虑了用户上网行为序列和移动通话用户网络的拓扑关联,充分利用了用户历史上网行为、用户通话行为、用户地理位置等数据,提出了一种基于时序神经网络模型的欺诈用户检测方法,有效提升了预测效果。
技术领域
本发明涉及互联网金融领域反欺诈领域,具体来说,涉及一种基于时序神经网络模型的欺诈用户检测系统。
背景技术
随着互联网的发展和普及,与互联网相结合的新兴产业也呈现出快速发展的态势。尤其是近年出现的互联网金融行业发展更是迅速。与此相伴的各种互联网金融平台和互联网金融系统也应运而生,蓬勃发展。像P2P互联网金融平台、众筹金融平台、电商小贷互联网金融平台、供应链金融互联网金融平台等等,这些平台对于优化金融游资配置,提高游资配置效率,解决中小企业融资难、融资贵的问题和中低收入散户的资产配置问题都起到了一定的积极作用。由于互联网金融平台的风险控制体系不规范、欺诈用户识别模块效果不佳,就给了“黑产”伪装成正常用户的机会。“黑产”借此来欺诈互联网金融平台,造成平台的巨大损失。
目前传统的欺诈用户识别方法大致可分为逻辑回归、GBDT、GBDT+LR 三类。上述模型将用户属性信息视为对象,将用户欺诈与否视为预测变量,提取用户年龄、用户职业情况、用户年平均收入、用户固定资产数额、以及分箱后的weight of evidence值等作为特征,然后选择随机森林、支持向量机、神经网络等构建模型。概括而言,现有方法主要基于客户的信用属性和基于专家经验的构造特征训练模型。然而,在互联网金融领域,存在着大量用户上网行为数据和通话行为数据。这些数据组成部分复杂,且所包含的信息量巨大,有产品页面停留时间、国际移动设备识别码、产品查看停留时间、IP地址、地理位置等等。面对这么大量且复杂的数据,传统的机器学习模型要想取得更好的效果,不仅需要耗费大量的时间和人力物力进行数据分析进而生成特征,而且也无法有效地学习用户行为之间的关联信息。
针对相关技术中的问题,目前尚未提出有效的解决方案。
发明内容
针对相关技术中的问题,本发明提出一种基于时序神经网络模型的欺诈用户检测系统及其挖掘方法,以克服现有相关技术所存在的上述技术问题。
本发明的技术方案是这样实现的:
根据本发明的一个方面,提供了一种基于时序神经网络模型的欺诈用户检测系统,包括:
处理模块,用于面向用户上网行为的数据处理;
提取模块,基于历史通话行为数据的特征提取;
检测模块,基于时序神经网络模型的欺诈用户检测;
修正模块,用于欺诈用户检测及修正。
优选的,上述面向用户上网行为的数据处理包括构建用户点击产品行为序列和提取反欺诈领域的传统特征。
优选的,所述构建用户点击产品行为序列基于存储于数据库的用户上网行为中,提取原始用户点击行为序列,同时丢弃最后行为不是点击产品的用户点击行为序列;
需要注意的是,每个用户点击序列的序列长度k必须是一致的(长度 k=50),对于长度小于k的点击序列在序列后面补上空点击,对于长度小于k的点击序列截取最后的k次点击行为。
优选的,所述提取反欺诈领域的传统特征基于存储于数据库的用户上网行为中,提取反欺诈领域的传统特征,特征如下:
数值型特征:页面停留时长,页面加载时长;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于联洋国融(北京)科技有限公司,未经联洋国融(北京)科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010030012.4/2.html,转载请声明来源钻瓜专利网。