[发明专利]基于马尔可夫过程的时间序列流数据异常检测方法在审
申请号: | 202110073422.1 | 申请日: | 2021-01-20 |
公开(公告)号: | CN112784896A | 公开(公告)日: | 2021-05-11 |
发明(设计)人: | 赵伟;王雪妹;张辉;李琦;王佳 | 申请(专利权)人: | 齐鲁工业大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62 |
代理公司: | 济南法友专利代理事务所(普通合伙) 37315 | 代理人: | 陈利超 |
地址: | 250000 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 马尔可夫 过程 时间 序列 数据 异常 检测 方法 | ||
1.一种基于马尔可夫过程的时间序列流数据异常检测方法,其特征在于:包括如下步骤:
S1、选择训练数据流;
S2、通过局部保持投影算法对所述训练数据流降维;
S3、通过基于肘部策略的K-Means聚类算法确定当前的模式类别,并将所述训练数据流进行模式划分;
S4、构建基于马尔可夫的异常检测模型;
S5、将待测试数据处理后输入到所述马尔可夫异常检测模型中,输出异常检测结果。
2.根据权利要求1所述的方法,其特征在于:步骤S2中,所述通过局部保持投影算法对所述训练数据流降维的过程包括如下步骤:
S201、定义训练数据流Rn中的样本数据为其中,t代表时间戳,n代表数据维度;
S202、构建训练数据集的目标函数:
S203、通过优化目标函数构建拉普拉斯矩阵K完成本地映射KT;
S204、将数据训练数据流映射至数据Rm中,其中m<n,其映射公式为:
Yt=KTXt。
3.根据权利要求2所述的方法,其特征在于:步骤S202中,所述目标函数为相邻时间样本距离的加权平方和,其目标函数的计算式为:
其中,表示相邻时间样本和在不同距离的权重,T表示训练数据的样本值。
4.根据权利要求2所述的方法,其特征在于:步骤S3中,所述通过基于肘部策略的K-Means聚类算法确定当前的模式类别,并将所述训练数据流进行模式划分的过程包括如下步骤:
S301、通过肘部策略确定聚类的模式数L,定义所有模式的集合为Ω;
S302、通过优化各模式中所有数据样本到模式中心的距离的平方和,将所述样本Yt,分为不同的模式,其计算式如下:
其中,Il,t为指示函数,当Il,t=1时,则第t个样本数据属于第l个模式;C1表示第l个模式的模式中心,其计算式如下:
S303、将所有样本数据进行分类后,定义g(t)表示样本所属的模式类别,其中,g(t)∈Ω。
5.根据权利要求4所述的方法,其特征在于:步骤S4中,构建基于马尔可夫的异常检测模型的过程包括:
S401、基于步骤S302中所述的样本数据所处的模式数,通过遍历所有不同模式之间的转移次数获得马尔可夫转移矩阵M=[mi,j]L×L,其中,mi,j表示第i个模式向第j个模式的转移概率;
S402、在所述马尔可夫转移矩阵M中引入松散模式ξ,获得对应的扩展矩阵并假设从松散模式向其他模式以及从其他模式向松散模式的传输概率为0;
S403、设定转移概率阈值λ,在扩展矩阵中,当mi,j≥λ时,代表从第i个模式向第j个模式的转移是概念漂移;当mi,j<λ时,代表从第i个模式向第j个模式的转移是不可能发生的,发生了异常。
6.根据权利要求5所述的方法,其特征在于:步骤S5中,将待测试数据处理后输入到所述马尔可夫异常检测模型中,输出异常检测结果的过程包括:
S501、设定被测数据为XT+1,并利用拉普拉斯矩阵K对被测数据XT+1进行降维获得YT+1;
S502、计算所述数据集YT+1与各所述模式中心Cl(1≤l≤L)的距离,确定所属模式,其计算公式如下:
其中,thre表示模式的距离阈值;
S406、基于扩展矩阵中的转移概率mg(T),g(T+1)判断是否发生异常,当mg(T),g(T+1)≥λ时,流数据正常,当mg(T),g(T+1)<λ时,流数据发生异常。
7.根据权利要求6所述的方法,其特征在于:所述拉普拉斯矩阵K对被测数据XT+1进行降维获得YT+1的处理方式与步骤S2中对训练数据流的处理方式相同。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于齐鲁工业大学,未经齐鲁工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110073422.1/1.html,转载请声明来源钻瓜专利网。