[发明专利]一种基于入侵检测模型的样本预测方法、装置及电子设备有效
申请号: | 201710463676.8 | 申请日: | 2017-06-19 |
公开(公告)号: | CN107276805B | 公开(公告)日: | 2020-06-05 |
发明(设计)人: | 姚海鹏;付丹阳;章扬;张培颖;王露瑶;殷志强 | 申请(专利权)人: | 北京邮电大学 |
主分类号: | H04L12/24 | 分类号: | H04L12/24;H04L29/06;G06F21/55;G06K9/62 |
代理公司: | 北京柏杉松知识产权代理事务所(普通合伙) 11413 | 代理人: | 马敬;项京 |
地址: | 100876 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 入侵 检测 模型 样本 预测 方法 装置 电子设备 | ||
1.一种基于入侵检测模型的样本预测方法,其特征在于,所述方法包括:
利用聚类算法,对获得的初始训练样本集中的样本进行聚类,得到第一预设数量个第一簇,其中,所述初始训练样本集包括无标记样本与有标记样本;
针对每个所述第一簇,利用预设的纯簇判定规则,判断其内的全部样本是否都属于同一个类别;如果是,则将该第一簇中的样本从所述初始训练样本集中抽离,并标记该第一簇的类别为:该第一簇中的任一有标记样本的类别;
获得由所述初始训练样本集中未被抽离的样本组成的目标训练样本集;
获得目标入侵检测模型以及初始测试样本集,其中,所述目标入侵检测模型基于所述目标训练样本集训练所得,所述初始测试样本集的样本类别与所述初始训练样本集的无标记样本的样本类别服从同一概率分布;
针对初始测试样本集中的每个样本,判断是否将其从所述初始测试样本集中抽离,如果是,将其从所述初始测试样本集中抽离;
获得由所述初始测试样本集中未被抽离的样本组成的目标测试样本集;并利用所述目标入侵检测模型,对所述目标测试样本集中的每个样本进行类别预测;
所述针对初始测试样本集中的每个样本,判断将其是否从所述初始测试样本集中抽离的步骤,包括:
获得距离该样本最近的第一簇,作为目标簇;
判断该目标簇是否为被标记类别的第一簇;如果是,则判定将该样本从所述初始测试样本集中抽离。
2.根据权利要求1所述的方法,其特征在于,如果判定该目标簇为被标记类别的第一簇,所述方法还包括:
将该样本的类别标记为:该目标簇的类别。
3.根据权利要求1所述的方法,其特征在于,每个所述第一簇包括有标记样本和/或无标记样本,所述利用预设的纯簇判定规则,判断其内的全部样本是否都属于同一个类别的步骤包括:
如果该第一簇内的有标记样本的都属于同一类别,并且该第一簇中的有标记样本所占的比值大于目标比值,则判定该第一簇内的全部样本都属于同一个类别,其中,所述目标比值为:表示所述初始训练样本集中的有标记样本所占的比值。
4.根据权利要求1所述的方法,其特征在于,将由所述纯簇判定规则判定的其内全部样本不都属于同一个类别的第一簇,作为第二簇,针对每个所述第二簇,所述方法还包括:
利用所述聚类算法,对该第二簇中的样本进行聚类,得到第二预设数量个子簇;
针对该第二簇中的每个所述子簇,判断其内的样本数是否小于第一预设阈值;
如果否,则利用所述纯簇判定规则,判断该子簇内的全部样本是否都属于同一个类别;如果判定该子簇内的全部样本都属于同一个类别,则将该子簇中的样本从所述初始训练样本集中抽离;如果判定该子簇内的全部样本不都属于同一个类别,则更新该子簇为:第二簇,返回执行所述利用所述聚类算法,对其内的样本进行聚类,得到第二预设数量个子簇的步骤,直到判断第二簇中的每个子簇的样本个数小于第一预设阈值。
5.根据权利要求1所述的方法,其特征在于,获得所述目标入侵检测模型的步骤,包括;
利用所述目标训练样本集训练预设的初始入侵检测模型,得到目标入侵检测模型;
或者,
对所述目标训练样本集进行处理,并用处理后的目标训练样本集训练预设的初始入侵检测模型,得到目标入侵检测模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京邮电大学,未经北京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710463676.8/1.html,转载请声明来源钻瓜专利网。