[发明专利]一种基于数据体系的联邦计算系统及方法有效

专利信息
申请号: 202211451519.2 申请日: 2022-11-21
公开(公告)号: CN115577034B 公开(公告)日: 2023-04-04
发明(设计)人: 陆志鹏;国丽;刘国栋;朱立锋;陈勃胜;朱海涛;杨化龙;李英帅;郑曦;周崇毅;赵健;温彦龙;乔亲旺;范国浩 申请(专利权)人: 中国电子信息产业集团有限公司
主分类号: G06F16/25 分类号: G06F16/25;G06F16/242;G06F16/22;G06N20/00
代理公司: 工业和信息化部电子专利中心 11010 代理人: 华枫
地址: 100190 北京市海淀区中*** 国省代码: 北京;11
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 数据 体系 联邦 计算 系统 方法
【权利要求书】:

1.一种基于数据体系的联邦计算系统,其特征在于,所述联邦计算系统支持联邦学习的训练、预测、使用、模型发布及模型管理功能,所述联邦计算系统包括:

用户端,为计算引擎的客户端,与计算引擎通信,接收用户基于联邦计算任务输入的SQL语句,并向所述计算引擎发起SQL语句,包括用于获取数据集的标准SQL语句,和用于描述联邦计算任务的扩展SQL语句,所述扩展SQL语句包括描述计算任务中的计算模型选择、参数定义及结果输出子句,计算模型包括以下中的至少一种:同态加密、横向联邦学习、纵向联邦学习及迁移学习;

数据库,用于存储联邦计算所需数据集及存储数据结果;

计算引擎,用于解析接收的所述SQL语句,获取工作流,并基于所述工作流和预置的参数模板配置生成工作流任务;

联邦计算基础服务,用于接收并执行所述工作流任务,并经计算结果经所述计算引擎存储至所述数据库,Arbiter arbiter位于所述联邦计算基础服务中,用来辅助多方完成联合建模,包括用来聚合梯度或者模型,参与以及分发公私钥,进行加解密服务;

所述计算引擎内部扩展了intersect、特征工程、同态加密算子,封装了横向联邦学习、纵向联邦学习、迁移学习的模型算法,所述计算引擎包括:

解析模块,用于解析所述SQL语句,通过第一处理模块处理所述标准SQL语句,得到第一处理结果;通过第二处理模块处理所述扩展SQL语句,得到第二处理结果,并基于所述第一处理结果和所述第二处理结果生成工作流,所述第一处理模块为标准语法处理器SGP,所述第二处理模块为扩展语法处理器EGP,使用 扩展语法处理器EGP 的词法分析器来扫描 SQL程序,标记拆分 SQL,通过查找“TRAIN” 或“federate”连续标记来拆分扩展 SQL;如果找到“federate”连续标记,在“federate”标记的开始位置拆分子字符串;SGP 将解析子字符串的前半部分,扩展语法处理器EGP将解析后半部分;

校验器,用于对所述工作流进行校验;

适配器,用于根据校验后的所述工作流对预置的参数模板进行配置,生成工作流任务;

所述校验器对所述工作流进行的校验工作包括:

检查初始化的角色及角色ID;

判断任务类型,并根据任务类型基于预设校验清单进行校验工作;

调用内部扩展同态加密算子使用paillier算法将数据加密后导入并映射到联邦学习框架的表空间;

与各参与方的数据做intersect求交集,切割数据;

当所述校验器判断所述任务类型为训练纵向逻辑回归模型时,则校验数据输入表是否存在,数据集是否符合规范。

2.一种基于数据体系的联邦计算方法,其特征在于,所述联邦计算方法采用如权利要求1所述的基于数据体系的联邦计算系统进行联邦计算,所述方法包括:

所述计算引擎接收用户端的SQL语句,获取工作流,并基于所述工作流和预置的参数模板配置生成工作流任务;

联邦计算基础服务接收并执行所述工作流任务,并将计算结果经所述计算引擎存储至所述数据库。

3.根据权利要求2所述的基于数据体系的联邦计算方法,其特征在于,所述计算引擎接收用户端的SQL语句,获取工作流,并基于所述工作流和预置的参数模板配置生成工作流任务具体包括:

通过解析模块解析所述SQL语句,通过第一处理模块处理所述标准SQL语句,得到第一处理结果;通过第二处理模块处理所述扩展SQL语句,得到第二处理结果,并基于所述第一处理结果和所述第二处理结构生成工作流;

通过校验器对所述工作流进行校验;

通过适配器根据校验后的所述工作流对预置的参数模板进行配置,生成工作流任务。

4.根据权利要求3所述的基于数据体系的联邦计算方法,其特征在于,所述校验器对所述工作流进行的校验工作包括:

检查初始化的角色及角色ID;

判断任务类型,并根据任务类型基于预设校验清单进行校验工作。

5.根据权利要求4所述的基于数据体系的联邦计算方法,其特征在于,当所述校验器判断所述任务类型为训练纵向逻辑回归模型时,则校验数据输入表是否存在,数据集是否符合规范。

6.根据权利要求2-5中任一项所述的基于数据体系的联邦计算方法,其特征在于,所述扩展SQL语句描述的计算模型包括以下中的至少一种:同态加密、横向联邦学习、纵向联邦学习及迁移学习。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电子信息产业集团有限公司,未经中国电子信息产业集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202211451519.2/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top