[发明专利]一种特征集合处理方法及系统在审
申请号: | 201910528083.4 | 申请日: | 2019-06-18 |
公开(公告)号: | CN112101398A | 公开(公告)日: | 2020-12-18 |
发明(设计)人: | 刘彦南;王坤 | 申请(专利权)人: | 深信服科技股份有限公司 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06K9/46;G06N20/00;G06Q10/04 |
代理公司: | 深圳市深佳知识产权代理事务所(普通合伙) 44285 | 代理人: | 王仲凯 |
地址: | 518055 广东省深圳市南*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 特征 集合 处理 方法 系统 | ||
1.一种特征集合处理方法,其特征在于,所述方法包括:
在预设模型评估周期内,确定当前机器学习模型预测每个被测样本的预测结果、及当前机器学习模型中每个特征对于每个被测样本的预测结果的影响数据,所述特征用于训练所述当前机器学习模型;
基于所述每个被测样本的预测结果,修正所述每个特征对于每个被测样本的预测结果的影响数据;
累加所述每个特征各自对应所有被测样本的影响数据,得到所述每个特征的总影响数据;
基于所述每个特征的总影响数据进行筛选,得到由N个特征构成的最优特征集合,N为正整数。
2.根据权利要求1所述的方法,其特征在于,还包括:
利用所述最优特征集合对所述当前机器学习模型进行训练,得到新的机器学习模型。
3.根据权利要求1所述的方法,其特征在于,所述在预设模型评估周期内,确定当前机器学习模型预测每个被测样本的预测结果、及当前机器学习模型中每个特征对于每个被测样本的预测结果的影响数据,包括:
在预设模型评估周期内,针对每个被测样本,确定所述当前机器学习模型预测所述每个被测样本的第一预测结果、及缺少单个特征的当前机器学习模型预测所述每个被测样本的第二预测结果;
将所述每个被测样本的第一预测结果和第二预测结果进行比较,得到所述单个特征针对于所述每个被测样本所对应的不同预测结果差异,并作为所述当前机器学习模型中每个特征对于每个被测样本的预测结果的影响数据。
4.根据权利要求1所述的方法,其特征在于,所述基于所述每个被测样本的预测结果,修正所述每个特征对于每个被测样本的预测结果的影响数据,包括:
获取所述每个被测样本的实际结果、及所述每个特征的初始影响数据;
判断所述每个被测样本的实际结果是否与预测结果一致;
若一致,针对所述每个特征,将特征的初始影响数据作为增加数据,对所述每个特征对于每个被测样本的预测结果的影响数据进行增加修正;
若不一致,针对所述每个特征,将特征的初始影响数据作为增加数据,对所述每个特征对于每个被测样本的预测结果的影响数据进行删减修正。
5.根据权利要求4所述的方法,其特征在于,还包括:
若所述每个被测样本的实际结果与预测结果不一致,确定新特征;
相应的,利用所述最优特征集合和所述新特征对所述当前机器学习模型进行训练,得到新的机器学习模型。
6.根据权利要求1-5中任一项所述的方法,其特征在于,所述基于所述每个特征的总影响数据进行筛选,得到由N个特征构成的最优特征集合,包括:
获取所述每个特征的总影响数据;
按照所述总影响数据对应的影响效果由高至低的顺序,对所述每个特征进行排序,得到特征序列;
选择所述特征序列中前N个特征进行集合,构成最优特征集合。
7.一种特征集合处理系统,其特征在于,包括:
影响数据确定单元,用于在预设模型评估周期内,确定当前机器学习模型预测每个被测样本的预测结果、及当前机器学习模型中每个特征对于每个被测样本的预测结果的影响数据,所述特征用于训练所述当前机器学习模型;
影响数据处理单元,用于基于所述每个被测样本的预测结果,修正所述每个特征对于每个被测样本的预测结果的影响数据;
特征处理单元,用于累加所述每个特征各自对应所有被测样本的影响数据,得到所述每个特征的总影响数据;
集合优化单元,用于基于所述每个特征的总影响数据进行筛选,得到由N个特征构成的最优特征集合,N为正整数。
8.根据权利要求7所述的系统,其特征在于,还包括:
模型训练单元,用于利用所述最优特征集合对所述当前机器学习模型进行训练,得到新的机器学习模型。
9.一种存储介质,其特征在于,所述存储介质包括存储的程序,其中,在所述程序运行时控制所述存储介质所在设备执行如权利要求1-6中任一项所述的特征集合处理方法。
10.一种处理器,其特征在于,包括其特征在于,所述处理器用于运行程序,其中,所述程序运行时执行如权利要求1-6中任一项所述的特征集合处理方法。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深信服科技股份有限公司,未经深信服科技股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201910528083.4/1.html,转载请声明来源钻瓜专利网。