[发明专利]一种基于数据体系的联邦计算系统及方法有效
申请号: | 202211451519.2 | 申请日: | 2022-11-21 |
公开(公告)号: | CN115577034B | 公开(公告)日: | 2023-04-04 |
发明(设计)人: | 陆志鹏;国丽;刘国栋;朱立锋;陈勃胜;朱海涛;杨化龙;李英帅;郑曦;周崇毅;赵健;温彦龙;乔亲旺;范国浩 | 申请(专利权)人: | 中国电子信息产业集团有限公司 |
主分类号: | G06F16/25 | 分类号: | G06F16/25;G06F16/242;G06F16/22;G06N20/00 |
代理公司: | 工业和信息化部电子专利中心 11010 | 代理人: | 华枫 |
地址: | 100190 北京市海淀区中*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 数据 体系 联邦 计算 系统 方法 | ||
1.一种基于数据体系的联邦计算系统,其特征在于,所述联邦计算系统支持联邦学习的训练、预测、使用、模型发布及模型管理功能,所述联邦计算系统包括:
用户端,为计算引擎的客户端,与计算引擎通信,接收用户基于联邦计算任务输入的SQL语句,并向所述计算引擎发起SQL语句,包括用于获取数据集的标准SQL语句,和用于描述联邦计算任务的扩展SQL语句,所述扩展SQL语句包括描述计算任务中的计算模型选择、参数定义及结果输出子句,计算模型包括以下中的至少一种:同态加密、横向联邦学习、纵向联邦学习及迁移学习;
数据库,用于存储联邦计算所需数据集及存储数据结果;
计算引擎,用于解析接收的所述SQL语句,获取工作流,并基于所述工作流和预置的参数模板配置生成工作流任务;
联邦计算基础服务,用于接收并执行所述工作流任务,并经计算结果经所述计算引擎存储至所述数据库,Arbiter arbiter位于所述联邦计算基础服务中,用来辅助多方完成联合建模,包括用来聚合梯度或者模型,参与以及分发公私钥,进行加解密服务;
所述计算引擎内部扩展了intersect、特征工程、同态加密算子,封装了横向联邦学习、纵向联邦学习、迁移学习的模型算法,所述计算引擎包括:
解析模块,用于解析所述SQL语句,通过第一处理模块处理所述标准SQL语句,得到第一处理结果;通过第二处理模块处理所述扩展SQL语句,得到第二处理结果,并基于所述第一处理结果和所述第二处理结果生成工作流,所述第一处理模块为标准语法处理器SGP,所述第二处理模块为扩展语法处理器EGP,使用 扩展语法处理器EGP 的词法分析器来扫描 SQL程序,标记拆分 SQL,通过查找“TRAIN” 或“federate”连续标记来拆分扩展 SQL;如果找到“federate”连续标记,在“federate”标记的开始位置拆分子字符串;SGP 将解析子字符串的前半部分,扩展语法处理器EGP将解析后半部分;
校验器,用于对所述工作流进行校验;
适配器,用于根据校验后的所述工作流对预置的参数模板进行配置,生成工作流任务;
所述校验器对所述工作流进行的校验工作包括:
检查初始化的角色及角色ID;
判断任务类型,并根据任务类型基于预设校验清单进行校验工作;
调用内部扩展同态加密算子使用paillier算法将数据加密后导入并映射到联邦学习框架的表空间;
与各参与方的数据做intersect求交集,切割数据;
当所述校验器判断所述任务类型为训练纵向逻辑回归模型时,则校验数据输入表是否存在,数据集是否符合规范。
2.一种基于数据体系的联邦计算方法,其特征在于,所述联邦计算方法采用如权利要求1所述的基于数据体系的联邦计算系统进行联邦计算,所述方法包括:
所述计算引擎接收用户端的SQL语句,获取工作流,并基于所述工作流和预置的参数模板配置生成工作流任务;
联邦计算基础服务接收并执行所述工作流任务,并将计算结果经所述计算引擎存储至所述数据库。
3.根据权利要求2所述的基于数据体系的联邦计算方法,其特征在于,所述计算引擎接收用户端的SQL语句,获取工作流,并基于所述工作流和预置的参数模板配置生成工作流任务具体包括:
通过解析模块解析所述SQL语句,通过第一处理模块处理所述标准SQL语句,得到第一处理结果;通过第二处理模块处理所述扩展SQL语句,得到第二处理结果,并基于所述第一处理结果和所述第二处理结构生成工作流;
通过校验器对所述工作流进行校验;
通过适配器根据校验后的所述工作流对预置的参数模板进行配置,生成工作流任务。
4.根据权利要求3所述的基于数据体系的联邦计算方法,其特征在于,所述校验器对所述工作流进行的校验工作包括:
检查初始化的角色及角色ID;
判断任务类型,并根据任务类型基于预设校验清单进行校验工作。
5.根据权利要求4所述的基于数据体系的联邦计算方法,其特征在于,当所述校验器判断所述任务类型为训练纵向逻辑回归模型时,则校验数据输入表是否存在,数据集是否符合规范。
6.根据权利要求2-5中任一项所述的基于数据体系的联邦计算方法,其特征在于,所述扩展SQL语句描述的计算模型包括以下中的至少一种:同态加密、横向联邦学习、纵向联邦学习及迁移学习。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子信息产业集团有限公司,未经中国电子信息产业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211451519.2/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置