[发明专利]基于深度机器学习模型的异常网络数据生成与预测方法有效
申请号: | 201811627720.5 | 申请日: | 2018-12-28 |
公开(公告)号: | CN109492193B | 公开(公告)日: | 2020-11-27 |
发明(设计)人: | 杨恺;窦绍瑜 | 申请(专利权)人: | 同济大学 |
主分类号: | G06F17/18 | 分类号: | G06F17/18;G06N3/08;G06Q10/04;G06Q10/06 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 蔡彭君 |
地址: | 200092 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 深度 机器 学习 模型 异常 网络 数据 生成 预测 方法 | ||
1.一种基于深度机器学习模型的异常网络数据生成与预测方法,其特征在于,包括:
步骤S1:收集系统组件的历史性能指标数据,并训练异常预测模型,
步骤S2:在线收集系统中所有组件的性能指标数据,
步骤S3:判断各组件是否存在与其有关联关系的组件,若为是,则执行步骤S4,反之,则执行步骤S5,
步骤S4:将两个组件的数据组合成二元组,计算该二元组的残差值,并输入至该二元组对应的异常预测模型,并执行步骤S6,
步骤S5:搜索该组件对应的异常预测模型,将该组件的性能指标数据输入至该组件所对应的异常预测模型,并执行步骤S6,
步骤S6:判断模型输出的预测结果,若为是存在异常,则进行报警;
所述步骤S1具体包括:
步骤S11:收集各个系统组件的历史性能指标数据,并两两组合成二元组,
步骤S12:判断各二元组内的数据是否具有关联关系,若为是,则执行步骤S13,反之,则执行步骤S14,
步骤S13:计算二元组内的数据的残差序列,提取出残差序列中的异常事件与正常事件,然后执行步骤S16,
步骤S14:判断是否还有未判断过关联关系的二元组,若为是,则执行步骤S12,反之,则执行步骤S15,
步骤S15:对于与其他组件无关联关系的组件,提取出该组件历史性能指标中的异常事件与正常事件,然后执行步骤S16,
步骤S16:对于每个二元组或单个的组件数据,使用异常事件与正常事件训练一个基于深度学习的异常预测模型,并保存每个异常预测模型;
所述步骤S12具体包括:
步骤S121:针对任一二元组内的数据,生成一个自回归模型,
步骤S122:评估每一个自回归模型的R均方值:
其中:R2为所求的R均方值,yt为t时刻y组件的性能指标,为使用给定的自回归模型模型θ对组件y在t时刻的预测值,θ为要评估的自回归模型,为y组件在时间窗口[1,t]内的平均值,N为历史性能指标数据的长度,
步骤S123:判断R均方值是否大于设定阈值,若为是,则存储该自回归模型,反之则丢弃该自回归模型;
所述自回归模型的生成过程具体包括:
步骤A1:输入两个组件x、y的历史正常性能指标[xt-k,xt-k-1,…,xt-k-m]与[yt,yt-1,…,yt-n],并确定自回归模型系数:
yt+a1yt-1+…+anyt-n=b0xt-k+b1xt-k-1+…+bmxt-k-m
其中:n,m,k为预设的自回归模型的参数,a1,…,an与b1,…,bm为自回归模型系数,
步骤A2:确定自回归模型:
θ=[a1,…,an,b1,…,bm]
所述步骤S4具体包括:
步骤S41:将两个组件的数据[xt-k,xt-k-1,…,xt-k-m]、[yt-1,yt-2,…,yt-n]组合成二元组,
步骤S42:搜索该二元组的自回归模型θ,以[xt-k,xt-k-1,…,xt-k-m]作为输入,预测另一个组件的性能指标预测公式如下:
其中:θ为自回归模型,
步骤S43:计算残差序列,[rt-L-1,rt-L-2,…,rt]残差序列计算公式如下:
其中是由自回归模型θ输出的预测值,yt是真实的性能指标值,rt为表征关联关系稳定性的残差值,
步骤S44:搜索该二元组对应的异常预测模型,输入残差值到该模型中;
所述异常预测模型为长短期记忆循环神经网络。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于同济大学,未经同济大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811627720.5/1.html,转载请声明来源钻瓜专利网。