[发明专利]显著标签生成方法、设备及存储介质在审

专利信息
申请号: 202111679757.4 申请日: 2021-12-31
公开(公告)号: CN114429178A 公开(公告)日: 2022-05-03
发明(设计)人: 吴杨;向彪;赵占胜 申请(专利权)人: 中和农信项目管理有限公司
主分类号: G06K9/62 分类号: G06K9/62;G06Q40/02
代理公司: 深圳中一联合知识产权代理有限公司 44414 代理人: 张良
地址: 100000 北京市*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 显著 标签 生成 方法 设备 存储 介质
【说明书】:

发明公开了一种显著标签生成方法、设备及存储介质,包括:获取目标业务场景下的样本数据;提取所述样本数据中的多个连续特征值,采用特征分箱聚类模型对多个所述连续特征值进行分箱处理,得到多个所述连续特征值对应的最优分箱策略,以及,所述连续特征值在最优分箱策略下分箱得到的各个标签客群的重要度排序结果;根据所述重要度排序结果提取显著标签。本发明通过特征分箱聚类模型,对连续特征值进行迭代分箱操作,得到连续特征值的最优分箱策略,同时客观量化分箱得到的标签客群的重要程度,提取显著标签,能够为风控策略的生成提供依据,提高风控的效率与准确性。

技术领域

本发明属于风险识别与监测控制技术领域,具体涉及一种显著标签生成方法、设备及存储介质。

背景技术

随着信息技术和互联网技术的快速发展,在线业务得到了快速的发展和广泛的应用,如支付业务、注册业务、营销业务、信用贷等。但是,随着在线业务的快速发展,经常会出现一些不法分子利用各种手段在在线业务中执行欺诈行为。因此,如何提高在线业务的安全性、对在线业务的风险进行控制得到了越来越多的关注和重视。在这种背景下,在线业务(业务场景)对应的风控模型(风险模型)也随之产生了。

风控领域的模型在上线后,往往需要等待一个完整的观察期后,才能对模型的特征进行重要度排序,因为只有经过完整的观察期,线上数据才会产生对应的数据标签,此时才可以基于线上数据与数据标签进行建模,输出线上数据的特征重要度分析结果,从而进行风险控制。此外,风控领域的分析对象一般是特征,而不是标签客群。如上月贷款余额这个特征,风控领域一般会将这个特征按某种方法划分为几个标签客群进行分析、对比,如将上月贷款余额这个特征划分为5000以下、5000-10000、10000-20000、20000以上四个标签,按现有技术,此时就算完成了特征的重要度排序,也无法知道标签的重要度,这是风控领域实现数据分析自动化的一个重要瓶颈。

发明内容

鉴于以上所述现有技术的不足,本发明的目的在于:提供一种显著标签生成方法、设备及存储介质,该方法基于特征分箱聚类模型,对样本中的多个连续特征值进行分箱处理,利用聚类分析量化目标业务场景对应的标签客群的重要程度,据此提取出其中的显著性标签客群,实现准确的风险监测与控制。

为实现上述发明目的,本发明提供以下技术方案:

一种显著标签生成方法,所述方法包括:

获取目标业务场景下的样本数据;

提取所述样本数据中的多个连续特征值,

采用特征分箱聚类模型对多个所述连续特征值进行分箱处理,得到多个所述连续特征值对应的最优分箱策略,以及,所述连续特征值在最优分箱策略下分箱得到的各个标签客群的重要度排序结果;

根据所述重要度排序结果提取显著标签。

根据一种具体的实施方式,上述风险标签处理方法中,所述采用特征分箱聚类模型对多个所述连续特征值进行分箱处理,包括:

遍历每个所述连续特征值,针对每个所述连续特征值,进行N次模拟分箱,在每次模拟分箱中,计算当前模拟分箱策略对应的差异分布值;根据N次模拟分箱的差异分布值确定该连续特征值对应的最优分箱策略,以及,该连续特征值在所述最优分箱策略下分箱得到的各个标签客群的重要度排序结果;

遍历结束后,得到每个所述连续特征值对应的最优分箱策略,以及,标签客群的重要度排序结果。

根据一种具体的实施方式,上述风险标签处理方法中,在提取所述样本数据中的多个连续特征值之前,

所述方法还包括:获取目标业务场景对应的风险模型,利用所述风险模型对所述样本数据进行预测,得到第一预测结果;

所述在每次模拟分箱中,计算当前模拟分箱策略对应的差异分布值,包括:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中和农信项目管理有限公司,未经中和农信项目管理有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111679757.4/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top