[发明专利]一种预测逾期用户资源返还表现的方法、装置和电子设备在审
申请号: | 202010699114.5 | 申请日: | 2020-07-20 |
公开(公告)号: | CN111950600A | 公开(公告)日: | 2020-11-17 |
发明(设计)人: | 吴恩慈 | 申请(专利权)人: | 上海淇馥信息技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06Q10/04;G06Q40/02 |
代理公司: | 上海点威知识产权代理有限公司 31326 | 代理人: | 杜焱 |
地址: | 200062 上海市普*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 预测 逾期 用户 资源 返还 表现 方法 装置 电子设备 | ||
本说明书实施例提供一种预测逾期用户资源返还表现的方法,通过特征分割和特征组合构建用于获取逾期特征的多种属性,按照构建的所述多种属性获取样本用户的逾期特征,通过对所述样本用户的逾期特征进行降维处理剔除所述逾期特征中的冗余特征,使得对数据的分析和处理维度更容易接近理想数据的属性,也就更容易获取理想数据,因而,利用所述逾期特征中的剩余特征构建资源返还表现预测模型,并利用所述资源返还表现预测模型和待预测用户的逾期信息预测所述待预测用户的资源返还表现,便能够提升模型对反例用户进行预测的准确率。
技术领域
本申请涉及互联网领域,尤其涉及一种预测逾期用户资源返还表现的方法、装置和电子设备。
背景技术
目前很多业务中,往往会存在实体资源或者虚拟资源的配给,供用户使用,后续用户返还这些资源可以结束这个业务。
为了能够提高风险管控水平,提升运营能力,业内通常会提前预测用户的资源返还表现。
为此,我们利用大数据构建了用于预测逾期用户资源返还表现的模型,然而,通过对众多案例进行分析发现,这种模型往往存在一个弊端:由于业务数据中,正常返还的情况较多,因此,用于训练模型的数据集中,正常数据与非正常数据的比例非常之高(甚至达到了10万:1的数量级),这就导致,这种模型很难支持对反例用户(将会产生非正常数据的)进行预测,由于反例用户本身比例小,因此,其影响也较小,业内人员很难主动的发现这个问题,也难产生动机来解决这个问题。
实际上,如果能将训练模型的方法进行优化,能够进一步提升对反例用户进行预测的准确率,进而使得运营水平进一步提高。
对现有技术进行分析发现,目前构建模型的方法是按照收集数据时所采用的数据属性直接进行建模,然而,由于正常数据的数据量极大,造成了正常数据与理想数据的极小偏差会带来极大的影响(理想数据只能无限接近,无法到达,而正常数据量越大,就需要越大的非正常数据来矫正这中偏差),而非正常数据的数据量又较少,这就造成了不平衡的现象,容易想到的解决方式就是,提升非正常数据的量,然而,现实情况是,非正常数据的量受业务量限制很难提升。那么,是否有其他方法呢,申请人想到,如果能够减小正常数据与理想数据的偏差,降低影响,进而使得利用少量的非正常数据构建模型依然能够支持对非正常用户(反例用户)进行预测。
那么,具体如何实现呢,可以参考本申请提出的一种新的预测逾期用户资源返还表现的方法。
在所述背景技术部分公开的上述信息仅用于加强对本公开的背景的理解,因此它可以包括不构成对本领域普通技术人员已知的现有技术的信息。
发明内容
本说明书实施例提供一种预测逾期用户资源返还表现的方法、装置和电子设备,用以提高对反例用户进行预测的准确率。
本说明书实施例提供一种预测逾期用户资源返还表现的方法,包括:
通过特征分割和特征组合构建用于获取逾期特征的多种属性;
按照构建的所述多种属性获取样本用户的逾期特征,通过对所述样本用户的逾期特征进行降维处理剔除所述逾期特征中的冗余特征;
利用所述逾期特征中的剩余特征构建资源返还表现预测模型,并利用所述资源返还表现预测模型和待预测用户的逾期信息预测所述待预测用户的资源返还表现。
可选地,所述利用所述资源返还表现预测模型和待预测用户的逾期信息预测所述待预测用户的资源返还表现,包括:
利用所述资源返还表现预测模型提取并处理所述待预测用户的逾期信息中的逾期特征,并预测所述待预测用户的资源返还时间。
可选地,还包括:
获取对所述样本用户施行辅助资源返还的辅助策略后的返还表现数据;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海淇馥信息技术有限公司,未经上海淇馥信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010699114.5/2.html,转载请声明来源钻瓜专利网。