[发明专利]一种用于在征信风控建模中补充正样本的方法和装置在审
申请号: | 202210099499.0 | 申请日: | 2022-01-27 |
公开(公告)号: | CN114463113A | 公开(公告)日: | 2022-05-10 |
发明(设计)人: | 周晓瑞;卓正兴;杨青 | 申请(专利权)人: | 度小满科技(北京)有限公司 |
主分类号: | G06Q40/02 | 分类号: | G06Q40/02;G06K9/62 |
代理公司: | 北京启坤知识产权代理有限公司 11655 | 代理人: | 姜冰莹 |
地址: | 100193 北京市海淀区*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 信风 建模 补充 样本 方法 装置 | ||
1.一种用于在征信风控建模中补充正样本的方法,其中,该方法包括:
从本机构的全量征信报告中选择出本机构的未用信用户所对应的多个征信报告;
针对所述多个征信报告中的每个征信报告,对该征信报告中的贷款记录进行解析并判断是否存在逾期贷款记录,若是,记录所述逾期贷款记录对应的明细信息,否则,为该征信报告添加无逾期标记;
从解析后的多个征信报告中筛选出用于征信风控建模的正样本。
2.根据权利要求1所述的方法,其中,所述未用信用户包括本机构拒绝授信的用户和/或在本机构授信通过但未实际用信的用户。
3.根据权利要求1或2所述的方法,其中,所述从解析后的多个征信报告中筛选出用于征信风控建模的正样本,包括:
从用户维度将解析后的多个征信报告聚合为多个征信报告集合;
从所述多个征信报告集合中筛选出用于征信风控建模的正样本。
4.根据权利要求3所述的方法,其中,所述从用户维度将解析后的多个征信报告聚合为多个征信报告集合,包括:
从用户维度对所述多个征信报告进行聚合,得到多个征信报告集合,并将每个征信报告集合内的各个征信报告按照所对应的征信报告查询时间进行排序。
5.根据权利要求3所述的方法,其中,所述从所述多个征信报告集合中筛选出用于征信风控建模的正样本,包括:
对于每个信报告集合,判断该征信报告集合中是否包括逾期征信报告,若不包括,跳过该征信报告集合,若包括,判断所述逾期征信报告之前是否存在未逾期征信报告,若不存在,跳过该征信报告集合,若存在,将所述未逾期征信报告筛选为用于征信风控建模的正样本。
6.根据权利要求3所述的方法,其中,所述从所述多个征信报告集合中筛选出用于征信风控建模的正样本,包括:
对于每个信报告集合,判断该征信报告集合中是否包括逾期征信报告,若不包括,跳过该征信报告集合,若包括,判断所述逾期征信报告之前是否存在未逾期征信报告,若不存在,跳过该征信报告集合,若存在,根据所述逾期征信报告中的逾期贷款记录对应的明细信息判断是否符合预定业务筛选条件,若是,将所述未逾期征信报告筛选为用于征信风控建模的正样本,否则,跳过该征信报告集合。
7.一种用于在征信风控建模中补充正样本的装置,其中,该装置包括:
用于从本机构的全量征信报告中选择出本机构的未用信用户所对应的多个征信报告的模块;
用于针对所述多个征信报告中的每个征信报告,对该征信报告中的贷款记录进行解析并判断是否存在逾期贷款记录,若是,记录所述逾期贷款记录对应的明细信息,否则,为该征信报告添加无逾期标记的模块;
用于从解析后的多个征信报告中筛选出用于征信风控建模的正样本的模块。
8.根据权利要求7所述的装置,其中,所述未用信用户包括本机构拒绝授信的用户以及在本机构授信通过但未实际用信的用户。
9.根据权利要求7或8所述的装置,其中,所述用于从解析后的多个征信报告中筛选出用于征信风控建模的正样本的模块,包括:
用于从用户维度将解析后的多个征信报告聚合为多个征信报告集合的模块;
用于从所述多个征信报告集合中筛选出用于征信风控建模的正样本的模块。
10.根据权利要求9所述的装置,其中,所述用于从用户维度将解析后的多个征信报告聚合为多个征信报告集合的模块,用于:
从用户维度对所述多个征信报告进行聚合,得到多个征信报告集合,并将每个征信报告集合内的各个征信报告按照所对应的征信报告查询时间进行排序。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于度小满科技(北京)有限公司,未经度小满科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210099499.0/1.html,转载请声明来源钻瓜专利网。