[发明专利]一种基于自学习的机器学习模型更新方法及系统有效
申请号: | 201810697200.5 | 申请日: | 2018-06-29 |
公开(公告)号: | CN108921301B | 公开(公告)日: | 2020-06-02 |
发明(设计)人: | 姚兴仁 | 申请(专利权)人: | 长扬科技(北京)有限公司 |
主分类号: | G06N20/00 | 分类号: | G06N20/00;G06F21/55 |
代理公司: | 厦门福贝知识产权代理事务所(普通合伙) 35235 | 代理人: | 郝学江 |
地址: | 100080 北京*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 自学习 机器 学习 模型 更新 方法 系统 | ||
1.一种基于自学习的机器学习模型更新方法,其特征在于,包括以下步骤:
S1、创建原机器学习模型,并将该原机器学习模型部署在线上;
S2、所述原机器学习模型在线上检测恶意攻击,并将检测到的恶意攻击作为负样本存储到负样本库;
S3、检测所述负样本库内的负样本数量,当所述负样本数量达到设置的阈值,则触发机器学习训练任务,创建新机器学习模型;
S4、根据设定的模型更新策略进行模型更新;
所述步骤S4具体包括:
设定:新机器学习模型准确率与分布区域分别为curP、curA,原机器学习模型准确率与分布区域分别为prevP、prevA,原机器学习模型驻留时间为T,时间参数K1、K2;
如果cur>prevP,则进行模型更新,
否则,计算新机器学习模型分布区域curA=curP,原机器学习模型分布区域prevA计算方式如下,
a、如果T<=K1,prevA=prevP;
b、如果T<K2,prevA=prevP*(1+(K2-T)/(K2-K1));
c、如果T>=k2,prevA=0;
生成随机数R=Random(0.5)*(curA+prevA),若R<curA,则进行模型更新,否则,不更新。
2.根据权利要求1所述的基于自学习的机器学习模型更新方法,其特征在于,所述创建原机器学习模型包括:收集训练机器学习所需的正样本、负样本,然后进行模型训练和模型测试。
3.根据权利要求1所述的基于自学习的机器学习模型更新方法,其特征在于,所述触发机器学习训练任务,创建新的机器学习模型包括:数据清洗、特征提取、模型训练、模型测试。
4.根据权利要求1至3任一项所述的基于自学习的机器学习模型更新方法,其特征在于,所述步骤S4之后还包括以下步骤:将执行完所述步骤S4之后的机器学习模型作为原机器学习模型,然后返回所述步骤S2继续执行,实现机器学习模型不断更新。
5.一种基于自学习的机器学习模型更新系统,其特征在于,包括:
负样本库单元,用于将通过部署在线上的原机器学习模型检测到的恶意攻击作为负样本进行存储;
机器学习训练单元,用于在负样本数达到设置的阈值时,触发机器学习训练任务,创建新机器学习模型;
模型更新单元,用于根据设定的模型更新策略进行模型更新;
所述根据设定的模型更新策略进行模型更新具体包括:
设定:新机器学习模型准确率与分布区域分别为curP、curA,原机器学习模型准确率与分布区域分别为prevP、prevA,原机器学习模型驻留时间为T,时间参数K1、K2;
如果curP>prevP,则进行模型更新,
否则,计算新机器学习模型分布区域curA=curP,原机器学习模型分布区域prevA计算方式如下,
A、如果T<=K1,prevA=prevP;
B、如果T<K2,prevA=prevP*(1+(K2-T)/(K2-K1));
C、如果T>=k2,prevA=0;
生成随机数R=Random(0.5)*(curA+prevA),若R<curA,则进行模型更新,否则,不更新。
6.根据权利要求5所述的基于自学习的机器学习模型更新系统,其特征在于,还包括原机器学习模型创建单元,用于收集训练机器学习所需的正样本、负样本,然后进行模型训练和模型测试,创建原机器学习模型,并将其部署在线上。
7.根据权利要求5所述的基于自学习的机器学习模型更新系统,其特征在于,所述机器学习训练任务,创建新机器学习模型包括:数据清洗、特征提取、模型训练、模型测试。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于长扬科技(北京)有限公司,未经长扬科技(北京)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201810697200.5/1.html,转载请声明来源钻瓜专利网。