[发明专利]联邦集成学习方法、装置、设备和存储介质在审
| 申请号: | 202111261571.7 | 申请日: | 2021-10-27 |
| 公开(公告)号: | CN114330756A | 公开(公告)日: | 2022-04-12 |
| 发明(设计)人: | 程勇;蒋杰;韦康;刘煜宏;陈鹏;陶阳宇 | 申请(专利权)人: | 腾讯科技(深圳)有限公司 |
| 主分类号: | G06N20/20 | 分类号: | G06N20/20;G06F17/18 |
| 代理公司: | 北京市柳沈律师事务所 11105 | 代理人: | 王娟 |
| 地址: | 518057 广东省深圳*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 联邦 集成 学习方法 装置 设备 存储 介质 | ||
1.一种联邦集成学习方法,包括:
根据第一概率分布从参与方的特征集合中选择第一数量的特征,所述第一概率分布是基于指数机制针对所述参与方的特征集合获得的;
基于所选择的第一数量的特征中的至少一部分特征,获得多个逻辑回归模型,并根据第二概率分布从所述多个逻辑回归模型中选择第二数量的逻辑回归模型,所述第二概率分布是基于指数机制针对所述多个逻辑回归模型获得的;以及
向融合端发送所述第二数量的逻辑回归模型中的至少一部分逻辑回归模型,以基于所述至少一部分逻辑回归模型进行集成融合并生成联邦集成模型。
2.如权利要求1所述的方法,其中,根据第一概率分布从参与方的特征集合中选择第一数量的特征包括:
对于所述参与方的特征集合中的每个特征,确定所述特征的特征分数,所述特征分数是基于所述特征与所述参与方的多个样本所对应的类别标签的相关性来确定的;
根据所述参与方的特征集合中的每个特征的特征分数,基于指数机制确定所述第一概率分布,所述第一概率分布包括所述参与方的特征集合中的每个特征被选择的概率;
根据所述第一概率分布,从所述参与方的特征集合中选择一个特征;以及
从所述参与方的特征集合中去除所选择的特征,以更新所述参与方的特征集合和所述第一概率分布,并基于所更新的特征集合和第一概率分布继续选择特征,直到所选择的特征的总数量达到所述第一数量。
3.如权利要求2所述的方法,其中,所述参与方的多个样本中的每个样本对应于两个类别标签之一,对于每个所述特征,通过所述特征的翻转标识来指示所述特征与所述两个类别标签的相关性,
其中,所述翻转标识为第一值的情况指示所述特征与所述两个类别标签中的第一类别标签同向相关,所述特征的特征分数包括基于所述特征与所述第一类别标签的同向相关性所确定的第一特征分数;
所述翻转标识为第二值的情况指示所述特征与所述两个类别标签中的所述第一类别标签反向相关,所述特征的特征分数包括基于所述特征与所述第一类别标签的反向相关性所确定的第二特征分数。
4.如权利要求3所述的方法,其中,根据所述参与方的特征集合中的每个特征的特征分数,基于指数机制确定所述第一概率分布包括:
根据所述参与方的特征集合中的所有特征的第一特征分数和第二特征分数,对于所述参与方的特征集合中的每个特征,基于指数机制确定所述特征被选择的概率,所述概率包括与所述第一特征分数相关联的同向概率和与所述第二特征分数相关联的反向概率;
其中,根据所述第一概率分布,从所述参与方的特征集合中选择一个特征包括:
根据所述第一概率分布,从所述参与方的特征集合中选择一个特征,并确定所述特征的翻转标识,所述第一概率分布包括所述参与方的特征集合中的每个特征被选择的同向概率和反向概率。
5.如权利要求2所述的方法,其中,基于所选择的第一数量的特征中的至少一部分特征,获得多个逻辑回归模型包括:
确定所述第一数量的特征中的最优特征及其对应的一维逻辑回归模型,所述最优特征的特征分数不小于所述第一数量的特征中的其他特征的特征分数;
从所述第一数量的特征中的所述其他特征中随机选取预定数量的特征;以及
对于所述最优特征和所选取的预定数量的特征,基于预定的权重取值空间构造多个逻辑回归模型,所述多个逻辑回归模型的数量与所述预定数量和所述预定的权重取值空间中所包括的权重取值数量相关。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于腾讯科技(深圳)有限公司,未经腾讯科技(深圳)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111261571.7/1.html,转载请声明来源钻瓜专利网。





