[发明专利]一种基于隐私保护的数据处理方法、装置及设备在审
申请号: | 202111425766.0 | 申请日: | 2021-11-26 |
公开(公告)号: | CN114036571A | 公开(公告)日: | 2022-02-11 |
发明(设计)人: | 吴若凡 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06F21/62 | 分类号: | G06F21/62;G06F16/27;G06F21/64;G06N20/00;G06K9/62;G06N3/08;G06V10/764;G06V10/82 |
代理公司: | 北京国昊天诚知识产权代理有限公司 11315 | 代理人: | 姜凤岩 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 隐私 保护 数据处理 方法 装置 设备 | ||
本说明书实施例公开了一种基于隐私保护的数据处理方法、装置及设备,该方法包括:获取待处理的目标数据,所述目标数据包括连续型结构化数据和/或图像类数据,然后,可以通过预设的多种不同的隐私预算,分别对所述目标数据进行差分隐私处理,得到每种隐私预算对应的差分隐私结果,基于多种不同的隐私预算对应的差分隐私结果,并通过预设的对比学习损失算法对目标模型进行训练,得到训练后的目标模型。
技术领域
本文件涉及计算机技术领域,尤其涉及一种基于隐私保护的数据处理方法、装置及设备。
背景技术
深度学习往往能通过复杂的大型架构和庞大的数据规模获得出众性能的模型,其中需要使用的训练样本往往需要标注以得到每个训练样本的标签数据,由于训练样本的标签数据在实际应用中往往要求高昂的标注成本,使得无监督学习或半监督学习成为这类情况下重要的技术工具。但是,在无监督学习或半监督学习中,大量无标注的训练样本在易于获取的同时也增加了隐私风险,例如,无监督学习中,在训练模型的过程中可能会允许攻击方通过查询模型(Query the Model)的方式提取原始的训练样本,从而使得个人隐私数据被窃取,在数据合规越发严格的当下,无监督学习或半监督学习中的隐私保护越来越受关注。对比学习(Contrastive Learning)是目前较为常用的预训练范式,也是较为典型的自监督技巧,对比学习可以通过最大化两个相同底层对象的不同数据增强(Augmentation)处理来实现自监督学习。为此,需要提供一种在对比学习中进行隐私保护处理,以实现预训练的同时不泄露用户隐私的技术方案。
发明内容
本说明书实施例的目的是提供一种在对比学习中进行隐私保护处理,以实现预训练的同时不泄露用户隐私的技术方案。
为了实现上述技术方案,本说明书实施例是这样实现的:
本说明书实施例提供的一种基于隐私保护的数据处理方法,所述方法包括:获取待处理的目标数据,所述目标数据包括连续型结构化数据和/或图像类数据。通过预设的多种不同的隐私预算,分别对所述目标数据进行差分隐私处理,得到每种隐私预算对应的差分隐私结果。基于多种不同的隐私预算对应的差分隐私结果,并通过预设的对比学习损失算法对目标模型进行训练,得到训练后的目标模型。
本说明书实施例提供的一种基于隐私保护的数据处理方法,应用于区块链系统,所述方法包括:获取基于隐私保护的对比学习的规则信息,采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约,并将所述第一智能合约部署到所述区块链系统中。当获取到待处理的目标数据时,调用所述第一智能合约,通过预设的多种不同的隐私预算,分别对所述目标数据进行差分隐私处理,得到每种隐私预算对应的差分隐私结果,所述目标数据包括连续型结构化数据和/或图像类数据。调用所述第一智能合约,并基于多种不同的隐私预算对应的差分隐私结果,通过预设的对比学习损失算法对目标模型进行训练,得到训练后的目标模型。
本说明书实施例提供的一种基于隐私保护的数据处理装置,所述装置包括:数据获取模块,获取待处理的目标数据,所述目标数据包括连续型结构化数据和/或图像类数据。差分隐私模块,通过预设的多种不同的隐私预算,分别对所述目标数据进行差分隐私处理,得到每种隐私预算对应的差分隐私结果。对比学习模块,基于多种不同的隐私预算对应的差分隐私结果,并通过预设的对比学习损失算法对目标模型进行训练,得到训练后的目标模型。
本说明书实施例提供的一种基于隐私保护的数据处理装置,所述装置为区块链系统中的装置,所述装置包括:合约部署模块,获取基于隐私保护的对比学习的规则信息,采用基于隐私保护的对比学习的规则信息生成相应的第一智能合约,并将所述第一智能合约部署到所述区块链系统中。差分隐私模块,当获取到待处理的目标数据时,调用所述第一智能合约,通过预设的多种不同的隐私预算,分别对所述目标数据进行差分隐私处理,得到每种隐私预算对应的差分隐私结果,所述目标数据包括连续型结构化数据和/或图像类数据。对比学习模块,调用所述第一智能合约,并基于多种不同的隐私预算对应的差分隐私结果,通过预设的对比学习损失算法对目标模型进行训练,得到训练后的目标模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111425766.0/2.html,转载请声明来源钻瓜专利网。