[发明专利]一种基于条件概率的时序日志样本自动标注方法及装置有效
申请号: | 201811584484.3 | 申请日: | 2018-12-24 |
公开(公告)号: | CN111428440B | 公开(公告)日: | 2023-08-15 |
发明(设计)人: | 戴妙荷;陈卓;尚晶;黄岩;陶涛;徐海勇 | 申请(专利权)人: | 中移动信息技术有限公司;中国移动通信集团有限公司 |
主分类号: | G06F40/117 | 分类号: | G06F40/117 |
代理公司: | 北京同达信恒知识产权代理有限公司 11291 | 代理人: | 郭润湘 |
地址: | 102209 北京市昌平区未来*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 条件 概率 时序 日志 样本 自动 标注 方法 装置 | ||
1.一种时序日志样本自动标注方法,其特征在于,包括:
根据日志库中每个第一类型的异常日志行的第一比值集合,确定第一时间窗口;所述第一时间窗口为每个所述第一类型的异常日志行所在时间戳之前需要截取的连续N个第一单位时长大小的时间段;N为正整数;每个所述第一类型的异常日志行的第一比值集合的每个比值为,该异常日志行所在的所述第一时间窗口时长的所有类型的日志中每个类型的日志行数目,与所述日志库中该类型日志行总数的比值;
根据每个所述第一类型的异常日志行的所述第一时间窗口内的第二比值集合,确定第二时间窗口;所述第二时间窗口为所述第一类型的异常日志行中每个异常日志行的时间戳之前,在所述第一时间窗口内需要截取的连续M个第二单位时长大小的时间段;所述第一单位时长大于所述第二单位时长;M为正整数;每个所述第一类型的异常日志行的所述第一时间窗口内的第二比值集合的每个比值为,该异常日志行所在的所述第二时间窗口时长的所有类型的日志中每个类型的日志行数目,与所述日志库中该类型日志行总数的比值;
将每个所述第一类型的异常日志行的所述第二时间窗口内的所有日志行标注为异常日志行。
2.如权利要求1所述的方法,其特征在于,包括:
确定满足第一预设条件的单位时长以及该单位时长需要截取的第一截取个数;所述第一预设条件是根据,每个所述第一类型的异常日志行的单位时长以及单位时长的截取个数确定的时间窗口内的,所述第一比值集合的每个比值与第一预设比值阈值关系设置的条件;
将满足所述第一预设条件的单位时长作为所述第一单位时长,以及将所述第一截取个数作为所述N。
3.如权利要求1所述的方法,其特征在于,包括:
确定满足第二预设条件的单位时长以及该单位时长需要截取的第二截取个数;所述第二预设条件是根据,每个所述第一类型的异常日志行的单位时长以及单位时长的截取个数确定的时间窗口内的,所述第二比值集合的每个比值与第二预设比值阈值关系设置的条件;
将满足所述第二预设条件的单位时长作为所述第二单位时长,以及将所述第二截取个数作为所述M。
4.如权利要求2所述的方法,其特征在于,包括:
所述第一预设条件为同时满足第一预设子条件、第二预设子条件和第三预设子条件;
所述第一预设子条件为Tf1∈(T0i+1,T0i+1-ΔT*n)且Pnf1Q;其中,Tf1为f1行日志对应的时间戳,T0i+1为第一类型的第i+1行对应的时间戳,ΔT为第一单位时长,n+1为第一截取个数,所述n+1等于所述N,Q为所述第一预设比值阈值,Pnf1为f1行在所述第一比值集合中的对应比值;
所述第二预设子条件为Tf2∈(T0i+1,T0i+1-ΔT*(n+1))且P(n+1)f2Q,Tf2为f2行日志对应的时间戳,P(n+1)f2为f2行在所述第一比值集合中的对应比值;
所述第三预设子条件为Tf3∈(T0i+1,T0i+1-ΔT*(n+2))且P(n+2)f3Q且P(n+1)F≤Q,Tf3为f3行日志对应的时间戳,P(n+2)f3为f3行在所述第一比值集合中的对应比值,其中F∈(fn+2,f3-1),fn+2表示ΔT*(n+2)的所述第一时间窗口内最早的所述第一类型的异常日志行,F为所述fn+2行日志至所述f3-1行日志中的任一行。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中移动信息技术有限公司;中国移动通信集团有限公司,未经中移动信息技术有限公司;中国移动通信集团有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201811584484.3/1.html,转载请声明来源钻瓜专利网。