[发明专利]一种基于可选隐私数据进行模型训练的方法及系统有效
申请号: | 201911329551.1 | 申请日: | 2019-12-20 |
公开(公告)号: | CN111062492B | 公开(公告)日: | 2022-05-17 |
发明(设计)人: | 陈超超;王力;周俊 | 申请(专利权)人: | 支付宝(杭州)信息技术有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00 |
代理公司: | 成都七星天知识产权代理有限公司 51253 | 代理人: | 杨永梅 |
地址: | 310000 浙江省杭州市*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 可选 隐私 数据 进行 模型 训练 方法 系统 | ||
1.一种基于可选隐私数据进行模型训练的方法;所述方法包括:
第三方接收至少来自第一终端和第二终端的第一类数据;并基于接收到的第一类数据及其对应的模型参数计算第一类累计数据;
第三方通过多方安全计算的方式获取累计损失值;所述累计损失值至少由第一终端和第二终端基于所述第一类累计数据、自身的第二类数据以及样本标签确定;
第三方将所述累计损失值参与第一类累计梯度和第二类累计梯度的计算,所述第一类累计梯度和第二类累计梯度用于更新至少基于所述第一终端和第二终端的联合训练模型的参数;
其中,所述第一终端和所述第二终端分别持有第一训练数据和第二训练数据,所述第一训练数据和所述第二训练数据对应不同样本的相同特征;
所述第一训练数据和所述第二训练数据中至少一个包括对应不同隐私等级的第一类数据和第二类数据;所述第一类数据和第二类数据对应于相同的训练样本。
2.根据权利要求1所述的方法,所述联合训练的模型包括线性回归模型或逻辑回归模型。
3.根据权利要求1所述的方法,第三方将所述累计损失值参与第一类累计梯度和第二类累计梯度的计算包括:
第三方通过多方安全计算的方式获取第二类累计梯度;所述第二类累计梯度至少由第一终端和第二终端基于自身的损失值以及第二类数据确定;
第三方基于所述第二类累计梯度更新第二类模型参数。
4.根据权利要求3所述的方法,第三方将所述累计损失值参与第一类累计梯度和第二类累计梯度的计算包括:
第三方基于所述累计损失值以及至少对应于第一终端和第二终端的第一类数据计算第一类累计梯度;
第三方基于所述第一类累计梯度更新第一类模型参数。
5.根据权利要求1所述的方法,所述第一训练数据和所述第二训练数据包括与实体相关的图像数据、文本数据或声音数据。
6.根据权利要求1所述的方法,所述多方安全计算的方式包括和共享。
7.一种基于可选隐私数据进行模型训练的系统;所述系统包括:
第一类数据接收模块,用于接收至少来自第一终端和第二终端的第一类数据;
第一类累计数据确定模块,用于基于接收到的第一类数据及其对应的模型参数计算第一类累计数据;
累计损失值确定模块,用于通过多方安全计算的方式获取累计损失值;所述累计损失值至少由第一终端和第二终端基于所述第一类累计数据、自身的第二类数据以及样本标签确定;
模型参数更新模块,用于将所述累计损失值参与第一类累计梯度和第二类累计梯度的计算,所述第一类累计梯度和第二类累计梯度用于更新至少基于所述第一终端和第二终端的模型的联合训练模型的参数;
其中,第一终端和第二终端分别持有第一训练数据和第二训练数据,所述第一训练数据和所述第二训练数据对应不同样本的相同特征;
所述第一训练数据和所述第二训练数据中至少一个包括对应不同隐私等级的第一类数据和第二类数据;所述第一类数据和第二类数据对应于相同的训练样本。
8.根据权利要求7所述的系统,所述联合训练的模型包括线性回归模型或逻辑回归模型。
9.根据权利要求7所述的系统,所述模型参数更新模块还用于:
通过多方安全计算的方式获取第二类累计梯度;所述第二类累计梯度至少由第一终端和第二终端基于自身的损失值以及第二类数据确定;
基于所述第二类累计梯度更新第二类模型参数。
10.根据权利要求9所述的系统,所述模型参数更新模块还用于:
基于所述累计损失值以及至少对应于第一终端和第二终端的第一类数据计算第一类累计梯度;
基于所述第一类累计梯度更新第一类模型参数。
11.根据权利要求7所述的系统,所述第一训练数据和所述第二训练数据包括与实体相关的图像数据、文本数据或声音数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于支付宝(杭州)信息技术有限公司,未经支付宝(杭州)信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911329551.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据管理方法、装置、系统、存储介质及电子设备
- 下一篇:一种接线端子及空调器
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置