[发明专利]特征筛选方法、设备、存储介质及程序产品在审
申请号: | 202210084862.1 | 申请日: | 2022-01-25 |
公开(公告)号: | CN114444592A | 公开(公告)日: | 2022-05-06 |
发明(设计)人: | 范昊;杨恺;王虎;黄志翔;彭南博 | 申请(专利权)人: | 京东科技控股股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N20/00;G06F17/18;G06F17/15 |
代理公司: | 北京同立钧成知识产权代理有限公司 11205 | 代理人: | 马明明;刘芳 |
地址: | 100176 北京市北京经济*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 特征 筛选 方法 设备 存储 介质 程序 产品 | ||
1.一种特征筛选方法,其特征在于,包括:
对联邦学习的各参与方提供的多个特征进行采样,获得多个特征子集;针对每个特征子集,计算所述特征子集的多个特征筛选指标;
针对每个特征子集的每个特征筛选指标,计算并得到所述特征筛选指标对应的分布函数曲线,并根据所述分布函数曲线确定所述特征筛选指标对应于所述特征子集的子集筛选阈值;
根据各所述子集筛选阈值,确定各所述特征筛选指标分别对应的特征筛选阈值;
根据各所述特征筛选指标分别对应的特征筛选阈值,对各特征子集的特征进行筛选,获得最终的特征筛选结果。
2.根据权利要求1所述的方法,其特征在于,所述对联邦学习的各参与方提供的多个特征进行采样,获得多个特征子集,包括:
对联邦学习的各参与方提供的多个特征进行随机采样,获得多个特征子集。
3.根据权利要求2所述的方法,其特征在于,所述特征包括标识信息,所述标识信息为编号,所述对联邦学习的各参与方提供的多个特征进行随机采样,获得多个特征子集,包括:
根据多个所述特征的编号进行排序,得到特征序列;
根据随机产生序列选择算法对所述特征序列进行随机采样,获得多个特征子集。
4.根据权利要求1所述的方法,其特征在于,不同的特征筛选指标对应于不同的滤波函数,所述分布函数为累积分布函数CDF,所述计算并得到所述特征筛选指标对应的分布函数曲线,包括:
计算所述特征筛选指标对应的滤波函数值;
将所述滤波函数值进行归一化处理,并将归一化后的滤波函数值按照预设顺序进行排序;
根据排序后的滤波函数值,计算得到所述CDF曲线。
5.根据权利要求4所述的方法,其特征在于,所述根据所述CDF曲线确定所述特征筛选指标对应于所述特征子集的子集筛选阈值,包括:
根据所述CDF曲线的梯度,定位出位于预设累计值的第一个水平线点;
将所述第一个水平线点对应的滤波函数值确定为所述特征筛选指标对应于所述特征子集的子集筛选阈值。
6.根据权利要求1所述的方法,其特征在于,所述根据各所述子集筛选阈值,确定各所述特征筛选指标分别对应的特征筛选阈值,包括:
针对每个特征筛选指标,计算各特征子集分别对应的子集筛选阈值的平均值;
将所述平均值确定为所述特征筛选指标的特征筛选阈值。
7.根据权利要求1-6任一项所述的方法,其特征在于,所述根据各所述特征筛选指标分别对应的特征筛选阈值,对各特征子集的特征进行筛选,获得最终的特征筛选结果,包括:
针对每个特征筛选指标,根据所述特征筛选指标的特征筛选阈值对各特征子集进行特征筛选,得到所述特征筛选指标对应的各新特征子集;根据所述特征筛选指标对应的各新特征子集,确定所述特征筛选指标对应的特征合集;
针对每个特征,根据所述特征在各特征合集中出现的次数,确定所述特征的得分;
根据各特征的得分,确定最终的特征筛选结果。
8.根据权利要求7所述的方法,其特征在于,所述根据所述特征筛选指标对应的各新特征子集,确定所述特征筛选指标对应的特征合集,包括:
将所述特征筛选指标对应的各新特征子集的并集作为所述特征筛选指标对应的特征合集。
9.根据权利要求7所述的方法,其特征在于,所述针对每个特征,根据所述特征在各特征合集中出现的次数,确定所述特征的得分,包括:
将所述特征在各特征合集中出现的次数的总和,确定为所述特征的得分。
10.根据权利要求7所述的方法,其特征在于,所述根据各特征的得分,确定最终的特征筛选结果,包括:
针对每个特征,若所述特征筛选指标的个数与所述特征的得分之间的差值小于预设值,则将所述特征加入最终的特征筛选结果。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于京东科技控股股份有限公司,未经京东科技控股股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210084862.1/1.html,转载请声明来源钻瓜专利网。