[发明专利]基于自适应调整权重的数据隐私保护方法及系统在审
| 申请号: | 202210798075.3 | 申请日: | 2022-07-06 |
| 公开(公告)号: | CN115495771A | 公开(公告)日: | 2022-12-20 |
| 发明(设计)人: | 陈益强;何雨婷;杨晓东;于汉超 | 申请(专利权)人: | 中国科学院计算技术研究所 |
| 主分类号: | G06F21/62 | 分类号: | G06F21/62;G06V10/764;G06V10/774;G06N3/04;G06N3/08;G06N20/00;G06Q10/04 |
| 代理公司: | 北京律诚同业知识产权代理有限公司 11006 | 代理人: | 祁建国;陈思远 |
| 地址: | 100080 北*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 自适应 调整 权重 数据 隐私 保护 方法 系统 | ||
1.一种基于自适应调整权重的数据隐私保护方法,其特征在于,包括:
步骤1、将已标注类别标签的辅助数据集输入全局模型,得到该全局模型在每类数据上的分类精度,作为类别可信度矩阵;
步骤2、至少一个客户端从云端获取该全局模型,该客户端初始化其本地模型,该客户端本地具有本地私有数据集,该本地私有数据集中样本对应有类别标签;将该本地私有数据集,输入该本地模型,得到本地模型的输出,以及分类损失;并将该本地私有数据集输入位于该客户端本地的该全局模型,得到该全局模型的输出,以及该本地私有数据中每个样本的分类精度,作为样本可信度矩阵;根据该样本可信度矩阵和该类别可信度矩阵,得到蒸馏损失;根据由该分类损失和该蒸馏损失构成的总损失,训练该本地模型;将训练完成的该本地模型的模型参数上传到该云端;
步骤3、该云端通过对收到的模型参数进行加权聚合,得到新模型。
2.如权利要求1所述的基于自适应调整权重的数据隐私保护方法,其特征在于,该步骤3包括:以该新模型替换该全局模型,循环执行该步骤1到3,直到该总损失收敛或达到预设迭代次数,全局模型训练更新结束,保存当前的全局模型作为最终模型,并对指定数据进行分类或预测。
3.如权利要求1所述的基于自适应调整权重的数据隐私保护方法,其特征在于,该蒸馏损失其中是类别的权重向量,⊙表示元素相乘;zg为全局模型的输出,z为本地模型的输出;
权重向量M中k1位置的值为:
M(x)[k1]=Mmax·[Mclass[k1]Msample(x)-0.1]+,
Msample(x)=1-(1-pg(x)[k2])0.5;
其中样本x属于类别k2,Ak1,k1是类别k1的召回率,Ak,k1表示类别k误预测为类别k2的概率;pg(x)[k2]表示该全局模型正确预测样本x的类别为k2的概率,Mmax为蒸馏损失项的上限值。
4.如权利要求1所述的基于自适应调整权重的数据隐私保护方法,其特征在于,该客户端为医疗机构数据中心或金融机构数据中心,该新模型用于对输入图像进行分类或对交易数据进行风险预测。
5.一种基于自适应调整权重的数据隐私保护系统,其特征在于,包括:
云端,用于将已标注类别标签的辅助数据集输入全局模型,得到该全局模型在每类数据上的分类精度,作为类别可信度矩阵;通过对收到的模型参数进行加权聚合,得到新模型;
至少一个客户端,从该云端获取该全局模型,该客户端初始化其本地模型,该客户端本地具有本地私有数据集,该本地私有数据集中样本对应有类别标签;将该本地私有数据集,输入该本地模型,得到本地模型的输出,以及分类损失;并将该本地私有数据集输入位于该客户端本地的该全局模型,得到该全局模型的输出,以及该本地私有数据中每个样本的分类精度,作为样本可信度矩阵;根据该样本可信度矩阵和该类别可信度矩阵,得到蒸馏损失;根据由该分类损失和该蒸馏损失构成的总损失,训练该本地模型;将训练完成的该本地模型的模型参数上传到该云端。
6.如权利要求5所述的基于自适应调整权重的数据隐私保护系统,其特征在于,该云端用于:以该新模型替换该全局模型,保存当前的全局模型作为最终模型,并对指定数据进行分类或预测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院计算技术研究所,未经中国科学院计算技术研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210798075.3/1.html,转载请声明来源钻瓜专利网。





