[发明专利]基于隐私计算的标签预测模型生成方法、预测方法、模型生成装置、系统及介质有效
申请号: | 202110562405.4 | 申请日: | 2021-05-24 |
公开(公告)号: | CN113032838B | 公开(公告)日: | 2021-10-29 |
发明(设计)人: | 徐慧囝;高昊宇;周枭 | 申请(专利权)人: | 易商征信有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F21/60;G06N20/00 |
代理公司: | 广州三环专利商标代理有限公司 44202 | 代理人: | 郝传鑫;贾允 |
地址: | 310051 浙江省杭州市滨*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 隐私 计算 标签 预测 模型 生成 方法 装置 系统 介质 | ||
本申请公开一种基于隐私计算的标签预测模型生成方法、预测方法、模型生成装置、系统及介质,本申请通过至少两个数据提供方获取目标共有特征数据;每个数据提供方从各自的业务数据中获取目标共有特征数据各自对应的待测对象的特有特征数据和数据标签;确定每个待测对象的随机配对数据;分别将每个待测对象的随机配对数据发送给协调服务器;协调服务器基于每个待测对象的随机配对数据得到随机配对数据集;利用随机配对数据集对标签预测模型进行训练,得到目标标签预测模型,将目标标签预测模型发送给至少两个数据提供方,可以实现在不共享多个数据提供方业务数据,对每方业务数据进行隐私保护的前提下,生成多个数据提供方业务数据的标签预测模型。
技术领域
本发明涉及大数据安全处理技术领域,尤其涉及基于隐私计算的标签预测模型生成方法、预测方法、模型生成装置、系统及介质。
背景技术
随着数字化经济时代的到来,数据作为生产要素,其价值愈发明显,越来越多的企业或组织需要与产业链上下游业务伙伴在数据流通和交易领域进行深度合作,只有通过各方数据协同计算,才能更好地释放数据价值。但用户对隐私日益重视,政策法规趋向严格,数据协作和隐私保护这一矛盾也日益严重,现有的一些政策或管理规范正在逐步加强对隐私数据的管理,如《金融机构客户身份识别和客户身份资料及交易记录保存管理办法》、《中国人民银行金融消费者权益保护实施办法》、《关于进一步加强征信信息安全管理的通知》、《个人金融信息保护规范》(JRT0171-2020)、《金融数据安全数据生命周期安全规范》、《金融科技创新应用测试规范》等文件中对用户的身份数据、交易数据等的收集、传输、存储、使用、删除、销毁各环节都要求进行安全防护,从安全技术和安全管理等方面,对个人信息保护提出了规范性要求。由于企业和机构对数据自身价值的保护以及对用户隐私授权的保护,数据被储存在不同地方,像一个个孤岛难以被有效的连接互动。因此,隐私计算应运而生,隐私计算是数据科学与工程、密码学、分布式计算与存储的综合工程,包括多方安全计算、可信硬件、联邦机器学习等多项技术。
其中,联邦机器学习,又名联邦学习、联合学习、联盟学习。联邦机器学习是一个机器学习框架,能够有效帮助多个机构在满足用户隐私保护、数据安全和政府法规的要求下,进行数据使用和机器学习建模。联邦学习作为分布式的机器学习范式,可以有效解决数据孤岛问题,让参与方在不共享数据的基础上联合建模,能够从技术上打破数据孤岛,实现多机构的大数据协作。
联邦学习定义了机器学习框架,在此框架下通过设计虚拟模型解决不同数据提供方在不交换数据的情况下进行协作的问题。虚拟模型是各方将数据聚合在一起的最优模型,各自区域依据模型为本地提供目标服务。联邦学习要求此建模结果应当无限接近传统模式,即,将多个数据提供方的数据汇聚到一处进行建模。但在多个数据提供方提供的数据没有共享ID的情况下,将各方的数据聚合在一起得到最优模型相当困难。
发明内容
为了解决上述技术问题,本发明提供一种基于隐私计算的标签预测模型生成方法、预测方法、模型生成装置、系统及介质,可以实现在不共享多个数据提供方业务数据的前提下,对多个数据提供方业务数据进行隐私计算,生成多个数据提供方业务数据的标签预测模型。
为了达到上述申请的目的,本申请提供了一种基于隐私计算的标签预测模型生成方法,该方法可以包括:
至少两个数据提供方获取目标共有特征数据;
每个数据提供方从各自的业务数据中获取所述目标共有特征数据各自对应的待测对象的特有特征数据和数据标签;
所述每个数据提供方分别基于所述目标共有特征数据,以及所述目标共有特征数据各自对应的待测对象的特有特征数据和数据标签,确定每个待测对象的随机配对数据,所述随机配对数据为所述每个待测对象对应的数据特征向量和数据标签的乘积和,所述每个待测对象对应的数据特征向量为所述每个待测对象对应的特有特征数据和对应的所述目标共有特征数据的向量组合;
所述每个数据提供方分别将每个待测对象的随机配对数据发送给协调服务器;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于易商征信有限公司,未经易商征信有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110562405.4/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种方便取拿的中药材储存装置
- 下一篇:逐次逼近型ADC及其异步逻辑控制电路