[发明专利]特征快速筛选方法及系统、金融风控数学模型构建方法及系统在审
申请号: | 202110135266.7 | 申请日: | 2021-02-01 |
公开(公告)号: | CN112861953A | 公开(公告)日: | 2021-05-28 |
发明(设计)人: | 林建明 | 申请(专利权)人: | 深圳无域科技技术有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06F30/20;G06Q40/08 |
代理公司: | 上海大邦律师事务所 31252 | 代理人: | 孙成 |
地址: | 518000 广东省深圳市南山区粤海街*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 快速 筛选 方法 系统 金融 数学模型 构建 | ||
本发明揭示了一种特征快速筛选方法及系统、金融风控数学模型构建方法及系统,所述筛选方法包括:对给定的数据集和变量空间根据指定排序方式排序后计算特征间的相关系数;将相关系数矩阵转换为(0,1)‑矩阵;相关系数高于设定值,将矩阵中的对应数据设置为1,否则设置为0;提取每个元素1在矩阵中的坐标,根据横纵坐标的大小来筛选保留的特征。本发明提出的特征快速筛选方法及系统、金融风控数学模型构建方法及系统,可提高在大数据场景中的建模效率。
技术领域
本发明属于风险控制技术领域,涉及一种风险控制系统,尤其涉及一种特征快速筛选方法及系统、金融风控数学模型构建方法及系统。
背景技术
风险控制是金融的关键,随着时代的发展,风控领域的一个总趋势是越来越信息化、模型化、智能化。
大数据建模下,成千上万的特征变量中间不免会存在:多个特征两两之间相似的情况,而如果特别相似的变量入模将对模型造成一些质量上的损害。
有鉴于此,如今迫切需要设计一种新的风险控制方式,以便克服现有风险控制方式存在的上述至少部分缺陷。
发明内容
本发明提供一种特征快速筛选方法及系统、金融风控数学模型构建方法及系统,可提高在大数据场景中的建模效率。
为解决上述技术问题,根据本发明的一个方面,采用如下技术方案:
一种特征快速筛选方法,所述筛选方法包括:
对给定的数据集和变量空间根据指定排序方式排序后计算特征间的相关系数;
将相关系数矩阵转换为矩阵;相关系数高于设定值,将矩阵中的对应数据设置为1,否则设置为0;
提取每个元素1在矩阵中的坐标,根据横纵坐标的大小来筛选保留的特征。
作为本发明的一种实施方式,所述根据横纵坐标的大小来筛选保留的特征步骤中,借助矩阵运算来提高效率。
作为本发明的一种实施方式,所述根据横纵坐标的大小来筛选保留的特征步骤具体包括:
步骤S301、准备数据;
步骤S302、按特征的重要程度由高到低对所有的特征列排序;
步骤S303、计算出该数据所有特征之间的相互性矩阵;
步骤S304、将该相关性矩阵转换为0-1矩阵;
步骤S305、将该矩阵主对角线上的所有元素都设为0;
步骤S306、将该矩阵中所有为1的元素的坐标装进一个列表A;
步骤S307、设置一个空列表B,列表B用于放置之后被筛除的特征;
步骤S308、开始遍历坐标列表A;
步骤S309、取出一组坐标;
步骤S310、判断该坐标的横坐标或纵坐标是否已在列表B中;若已在列表B中,则转至步骤S312,否则转至步骤S311;
步骤S311、将该坐标的横纵坐标中较大的一个添加入列表B;
步骤S312、判断坐标列表是否遍历完毕;若遍历完毕,则转至步骤S313,否则转至步骤S309;
步骤S313、筛选结束,列表B中的内容即本次被筛除的特征坐标。
根据本发明的另一个方面,采用如下技术方案:一种金融风控数学模型构建方法,所述金融风控数学模型构建方法包括:上述的特征快速筛选方法。
作为本发明的一种实施方式,所述金融风控数学模型构建方法具体包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳无域科技技术有限公司,未经深圳无域科技技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110135266.7/2.html,转载请声明来源钻瓜专利网。