[发明专利]联邦学习建模的多环节自定义优化方法、装置、设备和存储介质在审
| 申请号: | 202211680135.8 | 申请日: | 2022-12-27 |
| 公开(公告)号: | CN115982570A | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 李善钧;元张毅;郭家清 | 申请(专利权)人: | 上海欣兆阳信息科技有限公司 |
| 主分类号: | G06F18/213 | 分类号: | G06F18/213;G06F18/2135;G06N20/00;G06F21/62 |
| 代理公司: | 上海申浩律师事务所 31280 | 代理人: | 孟咪 |
| 地址: | 200030 上海*** | 国省代码: | 上海;31 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 联邦 学习 建模 环节 自定义 优化 方法 装置 设备 存储 介质 | ||
1.一种联邦学习建模的多环节自定义优化方法,其特征在于,包括:
步骤S1:从多个拥有本地数据的数据源获取原始特征数据;
步骤S2:对原始特征数据进行特征工程,特征工程包括特征清洗、特征预处理、特征选择以及特征降维,所述特征清洗选自删除异常值、补充缺失值或者控制采样比例中的一种或多种,所述特征预处理选自归一化、标准化、onehot中的一种或多种,所述特征选择基于IV或VIF,所述特征降维基于PCA或LDA;
步骤S3:选择LightGBM、纵向神经网络或Logistic Regression作为模型;
步骤S4:采用贝叶斯优化库中的HpyerOpt或Optuna对步骤S3中选择的模型进行超参数优化,从而确定最优超参数组合;
步骤S5:将步骤S2筛选出的特征数据和步骤S4获得的最优超参数组合代入步骤S3中选择的模型并训练模型,从而得到优化后的联邦学习模型。
2.如权利要求1所述的联邦学习建模的多环节自定义优化方法,其特征在于,进一步包括:步骤S6:对比上一次优化后的联邦学习模型与步骤S5获得的优化后联邦学习模型,覆盖并保存效果最优的联邦学习模型,输出当前效果最优的联邦学习模型。
3.如权利要求1所述的联邦学习建模的多环节自定义优化方法,其特征在于,在步骤S3中,最适宜业务场景的模型选择顺序为:最适宜业务场景的模型排序:LightGBM纵向神经网络Logistic Regression;如果计算资源和时间足够,模型选择排序为:纵向神经网络LightGBMLogistic Regression。
4.如权利要求1-4任一项所述的联邦学习建模的多环节自定义优化方法,其特征在于,所述联邦学习包括纵向联邦学习、横向联邦和联邦迁移学习。
5.一种联邦学习建模的多环节自定义优化装置,其特征在于,包括:
特征输入模块,所述特征输入模块用于从多个拥有本地数据的数据源获取原始特征数据;
特征工程模块,所述特征工程模块用于对原始特征数据进行特征工程,特征工程包括特征清洗、特征预处理、特征选择以及特征降维,所述特征清洗选自删除异常值、补充缺失值或者控制采样比例中的一种或多种,所述特征预处理选自归一化、标准化、onehot中的一种或多种,所述特征选择基于IV或VIF,所述特征降维基于PCA或LDA;
模型选择模块,所述模型选择模块用于选择LightGBM、纵向神经网络或LogisticRegression作为模型;
超参数优化模块,所述超参数优化模块用于采用贝叶斯优化库中的HpyerOpt或Optuna对选择的模型进行超参数优化,从而确定最优超参数组合;
模型训练模块,所述模型训练模块用于将特征工程模块筛选出的特征数据和超参数优化模块获得的最优超参数组合代入选择的模型并训练模型,从而得到优化后的联邦学习模型。
6.如权利要求5所述的联邦学习建模的多环节自定义优化装置,其特征在于,进一步包括:输出模块,所述输出模块用于对比上一次优化后的联邦学习模型与步骤S5获得的优化后联邦学习模型,覆盖并保存效果最优的联邦学习模型,输出当前效果最优的联邦学习模型。
7.如权利要求5所述的联邦学习建模的多环节自定义优化装置,其特征在于,最适宜业务场景的模型选择顺序为:最适宜业务场景的模型排序:LightGBM纵向神经网络Logistic Regression;如果计算资源和时间足够,模型选择排序为:纵向神经网络LightGBMLogistic Regression。
8.如权利要求5-7任一项所述的联邦学习建模的多环节自定义优化装置,其特征在于,所述联邦学习包括纵向联邦学习、横向联邦和联邦迁移学习。
9.一种电子设备,其特征在于,包括:存储器、处理器以及存储于所述存储器上并可在所述处理器上运行的计算机程序,所述计算机程序被所述处理器执行时实现如权利要求1-4中任一项所述的联邦学习建模的多环节自定义优化方法中的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1-4中任一项所述的联邦学习建模的多环节自定义优化方法中的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海欣兆阳信息科技有限公司,未经上海欣兆阳信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211680135.8/1.html,转载请声明来源钻瓜专利网。





