[发明专利]结合混合随机森林的关键信息基础设施资产识别方法有效
申请号: | 201910459868.0 | 申请日: | 2019-05-30 |
公开(公告)号: | CN110245693B | 公开(公告)日: | 2023-04-07 |
发明(设计)人: | 罗森林;门元昊;潘丽敏;陈传涛;秦枭喃 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G06F18/2431 | 分类号: | G06F18/2431;G06F18/2411;G06Q10/0639;G06Q50/26 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种结合混合随机森林的关键信息基础设施资产识别方法,属于计算机与信息科学技术领域。该方法包括:对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;结合德尔菲专家咨询法和主成分分析法,进行资产设施的关键影响因素分析,提取关键特征向量;将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。由于本发明提供的关键信息基础设施资产识别方法,在大数据下通过结合机器学习方法实现资产的特征构建和关键因素提取,通过分区构建各自的专家模型,提升识别的准确性和效率,并提高了模型的泛化能力和可扩展性。 | ||
搜索关键词: | 结合 混合 随机 森林 关键 信息 基础设施 资产 识别 方法 | ||
【主权项】:
1.结合混合随机森林的关键信息基础设施资产识别方法,其特征在于所述方法包括如下步骤:步骤1,对采集到的设施资产数据进行结构化处理并进行特征优化表达,得到扩展的特征向量;步骤1.1,将采集到的基础设施的设备日志、网络流量等复杂数据进行清洗优化获得原始资产数据;步骤1.2,以关键字、时段节点、行为组合、地理关联四个方面为基准,从原始资产数据中提取关键词特征向量、时段特征向量、行为特征向量和地理特征向量这四种特征向量;步骤1.3,分别对四种特征向量进行归一化、标准化和哑变量处理,并将其顺序拼接获得高维扩展特征向量;步骤2,为兼顾最终数据的客观性和完备性,结合德尔菲专家咨询法和主成分分析法,进行关键信息基础设施的关键影响因素分析,提取关键特征向量;步骤2.1,在客观上基于使用高斯核函数的支持向量机和随机森林的方法获得特征的权重;步骤2.2,获取所有特征的权重信息后,基于德尔菲专家咨询法原则,对特征进行多轮经验分析,得到特征的重要性权重;步骤2.3,结合专家经验与机器学习方法得到的客观影响因素分析,进行关键影响因素提取,获得最终的关键特征向量;步骤3,结合混合专家模型的设施资产识别是将多个随机森林判别模型与一个门控函数相结合,获得混合随机森林判决模型;步骤3.1,初始化设定每个样本被挑选为中心概率为
并设定专家模型的数量为K;步骤3.2,依样本概率挑选其中的一个样本,并通过公式![]()
赋予每个样本的权重;步骤3.3,将赋权后的样本训练擅长此识别此区域下的随机森林;步骤3.4,依据公式
和
更新下一次迭代中每个样本被挑选为中心样本的概率值,将其归一化;步骤3.5,判定混合专家模型数量是否达标,若达标则训练完毕到达步骤3.6,若未达标到则继续挑选中心点,回到步骤3.2训练一个新的专家模型;步骤3.6,完成混合随机森林的构建,并设定其判决函数为
步骤4,基于构建的混合随机森林模型实现对流量是否为关键资产基础设施的识别。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201910459868.0/,转载请声明来源钻瓜专利网。