[发明专利]一种时间序列异常检测方法、装置、电子设备及存储介质在审
| 申请号: | 202111613824.2 | 申请日: | 2021-12-27 |
| 公开(公告)号: | CN114462483A | 公开(公告)日: | 2022-05-10 |
| 发明(设计)人: | 李嘉玮 | 申请(专利权)人: | 天翼云科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100007 北京市东城区青*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 时间 序列 异常 检测 方法 装置 电子设备 存储 介质 | ||
本发明公开了一种时间序列异常检测方法、装置、电子设备及存储介质,该方法,包括:基于分割为至少两个子序列的时间序列,生成数据子集合和测试子集合;将数据子集合进行切分,生成至少一个数据文本;根据数据文本,生成对应数量的孤立树;根据孤立树,生成孤立森林;根据测试子集合和孤立森林,计算测试子集合中任一子序列的异常值。本发明提供的时间序列异常检测方法,通过将数据子集合进行切分,并生成对应数量的孤立树,使得可以并行生成多个孤立树,在数据量较大时,可以降低孤立树的规模,解决了现有技术中的在数据量较大时,会造成孤立树的规模较大从而耗费大量内存的缺陷。
技术领域
本发明涉及异常检测技术领域,具体涉及一种时间序列异常检测方法、装置、电子设备及存储介质。
背景技术
时间序列异常检测是数据挖掘领域重要的研究方向之一。在实际业务场景中有着十分广泛的应用。传统的基于统计与概率模型、线性模型以及基于相似度的异常检测模型大多针对正常实例构建模型,不符合模型分布的正常实例将被识别为异常实例,因此可能出现淹没效应。
孤立森林算法(IForest)是基于“异常点是孤立的”思想,通过递归的方式对时间序列数据空间进行切割来构造多个孤立树,异常点在这些孤立树构成的孤立森林中更容易被访问到。IForest算法是一种非参数检验的无监督算法,能够解决带标记数据稀少的问题。
随着互联网的高速发展,互联网的设备越来越多,数据源源不断地产生且呈指数级增长,在海量时间序列数据中进行异常检测是一个极具挑战性的问题。虽然孤立森林算法具有优秀的线性复杂度,传统方法大都计算复杂度较高,只能适用于低维和小数据量的数据,存在在数据量较大时,会造成孤立树的规模较大从而耗费大量内存的缺陷。
发明内容
因此,本发明要解决的技术问题在于克服现有技术中在数据量较大时,会造成孤立树的规模较大从而耗费大量内存的缺陷,从而提供一种时间序列异常检测方法、装置、电子设备及存储介质。
根据第一方面,本发明公开了一种时间序列异常检测方法,包括:基于分割为至少两个子序列的时间序列,生成数据子集合和测试子集合;将所述数据子集合进行切分,生成至少一个数据文本;根据所述数据文本,生成对应数量的孤立树;根据所述孤立树,生成孤立森林;根据所述测试子集合和所述孤立森林,计算所述测试子集合中任一子序列的异常值。
可选地,所述基于分割为至少两个子序列的时间序列,生成数据子集合和测试子集合,包括:获取时间序列;根据所述时间序列,确定所述时间序列内的边缘点;根据所述边缘点将所述时间序列分割为至少两个子序列;根据所述子序列,通过随机取样的方式生成数据子集合;根据所述子序列和所述数据子集合,获取剩余子序列;根据所述剩余子序列生成测试子集合。
可选地,所述将所述数据子集合进行切分,生成至少一个数据文本,包括:将所述数据子集合中的子序列的每一数据维度进行特征表示,生成与所述数据维度数量对应的特征向量;所述特征向量中包括均值、最大值和最小值;通过预设算法,将所述数据子集合切分为至少一个数据池;所述数据池内包括至少一个子序列;根据预设格式和所述数据池,将所述维度与所述特征向量映射为所述数据文本。
可选地,所述根据所述数据文本,生成对应数量的孤立树,包括:根据所述数据文本,获取数据维度;根据所述数据文本和所述数据维度,获取任一数据维度对应的分裂值区间;根据所述数据维度和所述分裂值区间,将所述数据文本进行分裂;根据所述分裂过程,生成孤立树;多次迭代,直至所述孤立树达到预设的最大深度。
可选地,所述根据所述孤立树,生成孤立森林,包括:通过预设算法,将所述孤立树进行聚合,使所述孤立树的结果收敛,形成所述孤立森林。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼云科技有限公司,未经天翼云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111613824.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种日志数据处理方法及装置
- 下一篇:一种索引建立的方法及装置、电子设备





