[发明专利]一种用于联邦学习的图形化模型全生命周期建模方法有效
申请号: | 201911134600.6 | 申请日: | 2019-11-19 |
公开(公告)号: | CN111104731B | 公开(公告)日: | 2023-09-15 |
发明(设计)人: | 崔晶晶;许泱洋 | 申请(专利权)人: | 北京集奥聚合科技有限公司 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06F9/451;G06F3/0486;G06N20/00 |
代理公司: | 北京瑞盛铭杰知识产权代理事务所(普通合伙) 11617 | 代理人: | 李绩 |
地址: | 100142 北京市海*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 用于 联邦 学习 图形 模型 生命周期 建模 方法 | ||
1.一种用于联邦学习的图形化模型全生命周期建模方法,其特征在于,包括如下步骤:
步骤S1,建模前对数据样本进行分析,确定联邦学习方案,参与方上传原始数据到建模平台的本地客户端后进行同态加密,加密完成后,其他参与方通过平台请求与该参与方数据进行联合分析运算,其中,其他参与方仅能得到联合分析运算结果,而不会直接获取参与方上传的原始数据;所述联合分析运算结果以图表形式通过可视化界面呈现;
步骤S2,根据联合分析运算结果,拟定建模策略,包括对数据进行的处理、加工、衍生、算法选择的过程;
步骤S3,采用拖拉拽方式,利用联邦特征工程手段对数据进行处理,包括:在运算时,目标变量Y标签的所属方先获取对方同态加密后的X维度,进行第一次信息交换;然后进行数据运算,将运算结果返回对方进行分析调试,进行第二次信息交换如此往复;
步骤S4,联邦模型训练过程:双方分别构建模型后,交换计算得到的中间态模型和损失函数,如此往复迭代;
步骤S5,构建完成联邦模型后,对所述联邦模型进行预测使用,其中,在预测使用过程中,参与方获知自己提供的数据变量的含义和权重,但无法获知其他参与方提供数据的含义,仅可获知其他参与方提供数据的权重;
步骤S6,对所述联邦模型的运行过程进行监控,得到模型监控统计指标,实现对联邦模型的维护迭代。
2.如权利要求1所述的用于联邦学习的图形化模型全生命周期建模方法,其特征在于,在所述步骤S1中,所述联邦学习方案包括:横向联邦、纵向联邦和迁移联邦学习。
3.如权利要求1所述的用于联邦学习的图形化模型全生命周期建模方法,其特征在于,所述同态加密为对参与方上传的原始数据进行加密,无需解密即可实现对加密后的数据进行分析运算,获取分析运算结果,最后对分析运算结果进行解密;参与方和建模平台均允许在无法获知其他参与方的原始数据的基础上,对加密后的数据进行运算,以对应对方数据进行模型优化。
4.如权利要求1所述的用于联邦学习的图形化模型全生命周期建模方法,其特征在于,在所述步骤S2中,所述联合分析运算结果包括:原始Y标签有效样本数量、横向联邦学习样本交集、纵向联邦学习总样本量、样本维度。
5.如权利要求1所述的用于联邦学习的图形化模型全生命周期建模方法,其特征在于,在所述步骤S3中,所述联邦特征工程手段包括:编码、分箱、特征组合、特征离散化、特征运算、时间切片、偏移量增维、PCA降维、IV特征筛选、算法特征筛选。
6.如权利要求1所述的用于联邦学习的图形化模型全生命周期建模方法,其特征在于,在步骤S4中,第一参与方将根据第一数据集计算所得的模型和损失函数给到第二参与方,第二参与方根据第二数据集调整模型并得到新的损失函数,再由第一参与方进一步优化,如此迭代反复,进行交换分析。
7.如权利要求1所述的用于联邦学习的图形化模型全生命周期建模方法,其特征在于,在所述步骤S6中,获取模型监控统计指标,包括:
参与方的双方在本地通过平台客户端进行同态加密,将同态加密后的数据双方进行数据交换,然后各自对交换后的加密数据进行计算统计计算,得出模型监控统计指标。
8.如权利要求7所述的用于联邦学习的图形化模型全生命周期建模方法,其特征在于,所述模型监控统计指标,包括:群体稳定性指标PSI、洛伦兹曲线KS、曲线下面积AUC,曲线下面积AUC被定义为接受者操作特征曲线ROC曲线下与坐标轴围成的面积,接受者操作特性曲线是指在特定刺激条件下,以被试在不同判断标准下所得的虚报概率为横坐标,以击中概率为纵坐标,画得的各点的连线。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京集奥聚合科技有限公司,未经北京集奥聚合科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911134600.6/1.html,转载请声明来源钻瓜专利网。
- 上一篇:数据处理方法及装置、存储介质及电子终端
- 下一篇:一种机械加工用的刀架