[发明专利]时间序列上事件检测方法和装置有效
申请号: | 201310051659.5 | 申请日: | 2013-02-17 |
公开(公告)号: | CN103995808B | 公开(公告)日: | 2018-02-02 |
发明(设计)人: | 郁抒思;姚良;李一明;何叶 | 申请(专利权)人: | 中国电信股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30;H04L12/26 |
代理公司: | 中国国际贸易促进委员会专利商标事务所11038 | 代理人: | 李浩 |
地址: | 100033 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 时间 序列 事件 检测 方法 装置 | ||
技术领域
本发明涉及智能管道领域,特别涉及一种时间序列上事件检测方法和装置。
背景技术
时间序列是对某一对象的某一属性按统一的时间间隔不断采样形成的序列。例如:某网络端口每天正午的瞬时流量构成时间序列。
非正式的说,时间序列上的事件检测是指检测出时间序列上的“波峰”,“波峰”称为“事件”,“波峰”说明在这一时间段的序列值明显高于正常,通常是某些特殊事件导致的。例如:网络流量序列上的事件可能源自洪泛攻击。
为了在检测事件时排除噪音(如孤立点)的影响,目前主要采用分段求和或定宽的窗口平滑技术。这两种技术有以下问题,可能造成错认或丢失事件:1)分段或窗口的长度设定需要先验知识;2)阈值的设定需要先验知识;3)不同长度的事件间缺乏统一的比较标准;4)滑动窗口法会模糊事件的边界。
发明内容
本发明实施例所要解决的一个技术问题是:解决传统事件检测技术需要先验知识,以及由于先验知识偏差所造成的错认事件或丢失事件的问题。
本发明实施例所要解决的另一个技术问题是:解决不同长度的事件间缺乏统一的比较标准的问题。
本发明实施例的一个方面提供了一种时间序列上事件检测方法,包括:将事件长度的搜索区间L分段,其中,L=(P,P+1,P+2,…,Q),P表示事件长度的最小值,Q表示事件长度的最大值;对于分段得到的每一段(p,q),计算sp、sq和s(p...q),其中,sp表示长度为p的子序列中和最大的子序列的重要程度,sq表示长度为q的子序列中和最大的子序列的重要程度,s(p...q)表示分段(p,q)对应的最大的重要程度;如果其中一段的s(p...q)小于其他任一段的sp或sq,将该段剪除;将剩余的每个段再继续分段,将继续分段得到的每一子段采用上述分段的方法继续进行剪除;直到事件长度的剩余搜索区间小到符合预设值,停止分段和剪除的操作,遍历事件长度的剩余搜索区间上的点,记录每一个点对应的重要事件及其重要程度,所有重要事件中重要程度最大的事件作为全局重要事件Ds。
所述对于分段得到的每一段(p,q),计算sp包括:分别计算长度为p的所有子序列的和,长度为p的子序列的和符合正态分布;选择部分长度为p的子序列作为采样,计算采样的均值和标准差,将采样的均值作为正态分布的均值,将采样的标准差作为正态分布的标准差;根据公式计算sp,其中,表示长度为p的子序列中和的最大值,μp表示长度为p的子序列的正态分布的均值,σp表示长度为p的子序列的正态分布的标准差,sp表示长度为p的子序列中和最大的子序列的重要程度。
所述对于分段得到的每一段(p,q),计算sq包括:分别计算长度为q的所有子序列的和,长度为q的子序列的和符合正态分布;选择部分长度为q的子序列作为采样,计算采样的均值和标准差,将采样的均值作为正态分布的均值,将采样的标准差作为正态分布的标准差;根据公式计算sq,其中,表示长度为q的子序列中和的最大值,μq表示长度为q的子序列的正态分布的均值,σq表示长度为q的子序列的正态分布的标准差,sq表示长度为q的子序列中和最大的子序列的重要程度。
所述对于分段得到的每一段(p,q),计算s(p...q)包括:根据公式计算s(p...q),其中,表示长度为q的子序列中和的最大值,μp表示长度为p的子序列的正态分布的均值,σp表示长度为p的子序列的正态分布的标准差,s(p...q)表示分段(p,q)对应的最大的重要程度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国电信股份有限公司,未经中国电信股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201310051659.5/2.html,转载请声明来源钻瓜专利网。
- 上一篇:用于计算外科手术设备位置的计算机实现技术
- 下一篇:用于生成一次性代码的方法