[发明专利]风控方法、电子装置及计算机可读存储介质在审
申请号: | 202010134480.6 | 申请日: | 2020-02-29 |
公开(公告)号: | CN111428874A | 公开(公告)日: | 2020-07-17 |
发明(设计)人: | 刘波;陈阳;庄伯金;王少军 | 申请(专利权)人: | 平安科技(深圳)有限公司 |
主分类号: | G06N3/08 | 分类号: | G06N3/08;G06Q40/02 |
代理公司: | 深圳市沃德知识产权代理事务所(普通合伙) 44347 | 代理人: | 高杰;于志光 |
地址: | 518000 广东省深圳市福田区福*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 方法 电子 装置 计算机 可读 存储 介质 | ||
本发明涉及智能决策技术领域,揭露了一种风控方法,该方法包括:收集预设类型的业务数据及与预设类型的业务数据相似的相似业务数据并输入至预先构建的神经网络模型,计算相似业务数据的分类损失值和预设类型的业务数据及相似业务数据神经网络模型每一隐藏层的自适应损失值,将分类损失值及所有隐藏层的自适应损失值之和作为总损失值代入并训练神经网络模型,得到优化的神经网络模型,将待预测业务数据输入到优化的神经网络模型,输出待预测业务数据的标签,根据标签得到待预测业务数据的风险预测值。本发明通过在神经网络上计算多层领域自适应损失函数,能过滤掉源域数据中的噪声,提升预测模型的性能。
技术领域
本发明涉及智能决策技术领域,尤其涉及一种风控方法、电子装置及计算机可读存储介质。
背景技术
在金融领域中,构建一条新业务线常会遇到冷启动问题。也就是新业务线建立之初需要对用户风险进行评估,而该业务线在上线之前用户的业务数据是不存在的或者是少量的。这种情况通常是利用其他与新业务数据相似的业务数据,来建立新业务的风控模型。
目前,有一些基于传统机器学习的迁移学习算法,如基于树模型的TrAdaBoost算法已被尝试用于风控模型。这种方法通过在训练一串模型的过程中修改样本权重来缩小源域和目标域训练样本分布的差异,效率较低。深度学习神经网络具有很强的表达能力,基于神经网络的迁移学习模型有很多,但目前大部分仅应用于图像、语音、文本处理等领域。而常见的应用于风控领域的神经网络模型是用相关业务线数据训练一个神经网络模型,之后再用新业务线测试阶段收集的少量数据fine-tune之前预训练的网络模型参数。这些方法都依赖于样本的原始特征来匹配源域和目标域,当原始特征稀疏或存在较多噪声时,这些方法得到的模型的性能会下降,预测不准确。
发明内容
鉴于以上内容,有必要提供一种风控方法,旨在解决源域数据中噪声较多导致预测模型的性能下降的问题。
本发明提供的风控方法,包括:
样本收集步骤:收集预设类型的业务数据,并收集与所述预设类型的业务数据相似的相似业务数据;
将所述相似业务数据输入至预先构建的神经网络模型,根据分类损失函数及所述相似业务数据的标签计算所述相似业务数据的分类损失值;
将所述预设类型的业务数据及所述相似业务数据输入至所述神经网络模型,利用自适应损失函数计算所述预设类型的业务数据及所述相似业务数据在所述神经网络模型每一隐藏层的自适应损失值;
将所述分类损失函数及所述多层自适应损失函数之和作为所述神经网络模型的目标损失函数,并将所述分类损失值及所有隐藏层的自适应损失值之和作为所述神经网络模型的总损失值,根据所述目标损失函数及总损失值训练所述神经网络模型,更新所述神经网络模型的参数值,直至训练完成确定所述神经网络模型每一层的参数,得到优化的神经网络模型;
将所述预设类型的无标签待预测业务数据输入到所述优化的神经网络模型,输出所述待预测业务数据的标签,根据所述标签得到所述待预测业务数据的风险预测值。
可选的,所述分类损失值的计算公式为:
其中,n为所述相似业务数据的样本数,i表示第i个样本,XS为输入样本,θ为所述神经网络中的所有参数,yS为样本标签,J为损失函数。
可选的,所述自适应损失值的计算公式为:
其中,是所述相似业务数据与所述预设类型的业务数据在网络 l层表示的MMD值,λ是反映对MMD值的惩罚程度的超参数。
可选的,所述风控方法还包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于平安科技(深圳)有限公司,未经平安科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010134480.6/2.html,转载请声明来源钻瓜专利网。