[发明专利]一种应用于金融场景的隐私特征IV值计算方法在审
申请号: | 202211293775.3 | 申请日: | 2022-10-21 |
公开(公告)号: | CN115600244A | 公开(公告)日: | 2023-01-13 |
发明(设计)人: | 李维成;袁文俊;李升林 | 申请(专利权)人: | 上海阵方科技有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60 |
代理公司: | 南昌金轩知识产权代理有限公司 36129 | 代理人: | 陈梅 |
地址: | 200232 上海市*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 金融 场景 隐私 特征 iv 计算方法 | ||
本发明涉及隐私计算技术领域,具体公开了一种应用于金融场景的隐私特征IV值计算方法,包括如下步骤:步骤S1,首先参与计算的双方生成一组公私钥对,其中,参与双方分别以即第一参与方和第二参与方表示;步骤S2,将第一参与方的公钥公开给第二参与方;步骤S3,第一参与方利用自己的公钥加密各个样本数据的标签值生成各个样本数据的密文标签值,并将样本数据的密文标签值发送给第二参与方;步骤S4,同时针对某一特征,第二参与方基于特征值对多个样本数据进行分组等步骤。本发明底层基于密码学的安全多方计算框架,安全性可验;同时本发明对金融场景下隐私计算的各种隐私计算方法如逻辑预测、逻辑回归提供了很好的基础设施。
技术领域
本发明涉及隐私计算技术领域,具体是一种应用于金融场景的隐私特征IV值计算方法。
背景技术
随着机器学习、联邦学习等新兴技术的不断崛起和发展,传统金融行业也开始逐步接触和探索机器学习的一些常用算法和模型。其中特征IV值(Inform第一参与方tion V第一参与方lue)是机器学习二分类问题中一个比较重要的指标,其主要用来对输入变量进行编码和预测能力的评估。特征变量IV值的大小即表示该变量预测能力的强弱。虽然目前市面上已经有了一些与之相关的一些算法和说明,但这些算法很难直接拿过来用于一些隐私计算的系统或方法上,故在金融场景中落地的难度更是可想而知。
传统机器学习算法中,特征变量越多越大时,需要计算特征IV进行筛选,IV值越高,表示特征蕴含信息量越大,越适合于机器学习算法的模型训练。而随着数据隐私及安全保护的日重要性日益提升,基于明文数据计算IV值的方法已经难以满足隐私保护要求,当然使用MPC技术可解决当前的隐私安全的问题,但同时MPC技术对通信宽带要求较高,当数据量很大时,计算成本及时间成本也非常的高,故用这些技术的算法和系统很难在金融场景下落地。
综上所述本发明提出一种应用于金融场景的隐私特征IV值计算方法。
发明内容
本发明的主要基于部分金融场景的业务和需求特点,提出了一种应用于金融场景的隐私特征IV值计算方法;我们在用逻辑回归、决策树等模型方法构建分类模型时,经常需要对自变量进行筛选,挑选入模变量过程是个比较复杂的过程,需要考虑很多因素,比如变量之间的相关性、变量的预测能力、变量在业务上的可解释性等,其中最主要和直接的衡量标准就是变量的预测能力;隐私IV特征值就是用来解决这个问题的存在,他可以用来衡量自变量的预测能力,从而为我们提供更准确的入模变量。
为实现上述目的,本发明提供如下技术方案:一种应用于金融场景的隐私特征IV值计算方法,包括如下步骤:
步骤S1,首先参与计算的双方生成一组公私钥对,其中,参与双方分别以即第一参与方和第二参与方表示;
步骤S2,将第一参与方的公钥公开给第二参与方;
步骤S3,第一参与方利用自己的公钥加密各个样本数据的标签值生成各个样本数据的密文标签值,并将样本数据的密文标签值发送给第二参与方;
步骤S4,同时针对某一特征,第二参与方基于特征值对多个样本数据进行分组,并结合各个样本数据的密文标签值以及第一参与方的公钥计算每个分组的密文WOE值;
步骤S5,第二参与方将各分组的密文WOE值进行累加,得到该特征的最终密文WOE值;
步骤S6,通过各分组的密文WOE值计算出各个分组的密文特征IV值;
步骤S7,第二参与方将计算后的最终密文特征IV值加密后发送给第一参与方;
步骤S8,第一参与方利用自己的私钥解密该特征的最终密文特征IV值,得到该特征的明文特征IV值,并将其发送给第二参与方;
步骤S9,第二参与方得到该特征的最终IV值后继续在系统中进行特征工程或者逻辑预测的工程构建。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海阵方科技有限公司,未经上海阵方科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211293775.3/2.html,转载请声明来源钻瓜专利网。