[发明专利]一种建立逾期风险识别模型的方法和装置在审
申请号: | 202111011659.3 | 申请日: | 2021-08-31 |
公开(公告)号: | CN113902539A | 公开(公告)日: | 2022-01-07 |
发明(设计)人: | 熊伟灼;杨青 | 申请(专利权)人: | 度小满科技(北京)有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 北京启坤知识产权代理有限公司 11655 | 代理人: | 姜冰莹 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 建立 逾期 风险 识别 模型 方法 装置 | ||
本申请提供了一种建立逾期风险识别模型的方法,其中,所述方法包括:获得周期性行为对应的训练数据;对所述训练数据执行数据预处理操作,利用数据预处理后的数据建立特征工程,获得所述训练数据对应的数据特征信息;根据所述数据特征信息,并使用与所述周期性行为对应的损失函数,训练得到逾期风险识别模型,其中,所述损失函数中的参数包括标签以及期数,所述期数由用户的逾期行为来确定。根据本申请的方案,能够通过让模型学习用户是否逾期以及用户逾期的期数,精细刻画用户风险,从而识别出逾期速度更快的用户。
技术领域
本申请涉及计算机技术领域,尤其涉及一种预建立逾期风险识别模型的技术方案。
背景技术
大数据风控是指通过运用大数据构建模型的方法进行风险控制和风险提示,通常风控建模的步骤包括数据获取、样本筛选、数据清洗、特征工程及模型建立。现有技术在针对周期性行为进行风控建模时,一般在定义好特征和标签后,就可以用模型直接学习每个用户逾期的概率,而标签的定义是用户在周期性行为对应的整个过程是否出现过逾期,也即,对所有出现逾期的用户统一标注为坏用户,现有技术在建模过程中也仅考虑上述所定义的标签,由此所建立的风控模型仅能用于识别用户是否逾期。
发明内容
本申请的目的是提供一种基于多任务学习的建立逾期风险识别模型的技术方案,通过在建模过程中考虑基于用户逾期行为所确定的期数,使得能够通过逾期风险识别模型学习用户是否逾期以及用户逾期的账期,从而精细刻画用户风险,识别出逾期速度更快的用户。
根据本申请的一个实施例,提供一种建立逾期风险识别模型的方法,其中,所述方法包括:
获得周期性行为对应的训练数据;
对所述训练数据执行数据预处理操作,利用数据预处理后的数据建立特征工程,获得所述训练数据对应的数据特征信息;
根据所述数据特征信息,并使用与所述周期性行为对应的损失函数,训练得到逾期风险识别模型,其中,所述损失函数中的参数包括标签以及期数,所述期数由用户的逾期行为来确定。
根据本申请的另一个实施例,还提供了一种建立逾期风险识别模型的装置,其中,所述装置包括:
用于获得周期性行为对应的训练数据的装置;
用于对所述训练数据执行数据预处理操作,利用数据预处理后的数据建立特征工程,获得所述训练数据对应的数据特征信息的装置;
用于根据所述数据特征信息,并使用与所述周期性行为对应的损失函数,训练得到逾期风险识别模型的装置,其中,所述损失函数中的参数包括标签以及期数,所述期数由用户的逾期行为来确定。
根据本申请的另一个实施例,还提供了一种计算机设备,其中,所述计算机设备包括:存储器,用于存储一个或多个程序;一个或多个处理器,与所述存储器相连,当所述一个或多个程序被所述一个或者多个处理器执行时,使得所述一个或多个处理器执行如下操作:
获得周期性行为对应的训练数据;
对所述训练数据执行数据预处理操作,利用数据预处理后的数据建立特征工程,获得所述训练数据对应的数据特征信息;
根据所述数据特征信息,并使用与所述周期性行为对应的损失函数,训练得到逾期风险识别模型,其中,所述损失函数中的参数包括标签以及期数,所述期数由用户的逾期行为来确定。
根据本申请的另一个实施例,还提供了一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序可被处理器执行如下操作:
获得周期性行为对应的训练数据;
对所述训练数据执行数据预处理操作,利用数据预处理后的数据建立特征工程,获得所述训练数据对应的数据特征信息;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111011659.3/2.html,转载请声明来源钻瓜专利网。