[发明专利]一种基于生成对抗网络的弱监督互联网金融反欺诈方法在审
| 申请号: | 201910761996.0 | 申请日: | 2019-08-19 |
| 公开(公告)号: | CN110544168A | 公开(公告)日: | 2019-12-06 |
| 发明(设计)人: | 王成;胡腾 | 申请(专利权)人: | 同济大学 |
| 主分类号: | G06Q40/04 | 分类号: | G06Q40/04;G06Q30/00;G06K9/62;G06N3/04;G06N3/08 |
| 代理公司: | 31227 上海伯瑞杰知识产权代理有限公司 | 代理人: | 孟旭彤<国际申请>=<国际公布>=<进入 |
| 地址: | 200000 *** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 欺诈 生成模型 互联网 对抗 交易数据 判别模型 网络 信息量 收敛 预处理 金融 技术方案要点 样本生成器 金融网络 欺诈检测 神经网络 随机生成 预测模型 真实数据 鲁棒性 准确率 拦截 监督 引入 评估 交易 | ||
1.一种基于生成对抗网络的弱监督互联网金融反欺诈方法,其特征是,包括有以下步骤:
对互联网金融产生的交易数据进行预处理以能进行模型的计算;
建立生成对抗网络的生成模型和判别模型,根据真实数据和随机生成的数据交替训练判别模型和生成模型直至模型收敛;
将收敛的生成对抗网络中的生成模型作为样本生成器,用来生成欺诈的标签数据;
通过生成的标签数据训练预测模型,以通过预测模型进行交易数据评估。
2.根据权利要求1所述的基于生成对抗网络的弱监督互联网金融反欺诈方法,其特征是,具体步骤如下:
预处理:对原始的数据通过数据清理、数据集成及数据变化将数据转换成可参与模型计算的形式;
建模:建立不断学习训练集中的真实数据的概率分布,将输入的随机噪声转换成伪数据的生成模型;建立判断一条记录是否是真实的数据,且将生成模型产生的伪数据与数据中的真数据区分的判别模型;
训练:通过真实数据和随机生成的数据同时输入判别模型进行训练,并且更新判别模型的参数;将损失函数中的损失反馈给生成模型以调整生成模型的参数,并训练生成模型;交替训练判别模型和生成模型直至模型收敛;
评估:将收敛的生成模型作为交易数据评估中欺诈数据的样本生成器,生成欺诈的标签数据并训练神经网络中的预测模型,以对交易数据进行预测评估。
3.根据权利要求2所述的基于生成对抗网络的弱监督互联网金融反欺诈方法,其特征是,所述预处理中具体步骤包括有:
数据清理:通过填写缺失值,光滑噪声数据,识别/解决不一致来清理数据,实现数据的格式化标准、异常数据的清除、错误纠正及重复数据的清除;
数据集成:将多个数据源中的数据结合起来并统一存储,建立数据仓库;
数据变换:通过平滑聚集、数据概化、规范化将数据转换成学习模型需要的数值型数据。
4.根据权利要求2所述的基于生成对抗网络的弱监督互联网金融反欺诈方法,其特征是:判别模型及判别模型的参数的更新具体如下:
从生成模型生成的数据及真实欺诈数据中均选取等量若干样本,计算下式采用随机梯度下降更新判别模型参数,计算公式为:
从生成模型生成的数据中选取若干样本,计算下式通过随机梯度下降更新生成模型参数,计算公式如下:
更新直至模型收敛,若模型未收敛则增加选取的样本再次计算更新;
其中,z(i)为生成模型生成的数据中选取的样本,x(i)为正式欺诈数据中选取的样本,m为样本数量。
5.根据权利要求1所述的基于生成对抗网络的弱监督互联网金融反欺诈方法,其特征是:生成模型及判别模型均为长短期记忆网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910761996.0/1.html,转载请声明来源钻瓜专利网。





