[发明专利]一种时间序列异常检测方法、装置、电子设备及存储介质在审
| 申请号: | 202111613824.2 | 申请日: | 2021-12-27 |
| 公开(公告)号: | CN114462483A | 公开(公告)日: | 2022-05-10 |
| 发明(设计)人: | 李嘉玮 | 申请(专利权)人: | 天翼云科技有限公司 |
| 主分类号: | G06K9/62 | 分类号: | G06K9/62 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 100007 北京市东城区青*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 时间 序列 异常 检测 方法 装置 电子设备 存储 介质 | ||
1.一种时间序列异常检测方法,其特征在于,包括:
基于分割为至少两个子序列的时间序列,生成数据子集合和测试子集合;
将所述数据子集合进行切分,生成至少一个数据文本;
根据所述数据文本,生成对应数量的孤立树;
根据所述孤立树,生成孤立森林;
根据所述测试子集合和所述孤立森林,计算所述测试子集合中任一子序列的异常值。
2.根据权利要求1所述的时间序列异常检测方法,其特征在于,所述基于分割为至少两个子序列的时间序列,生成数据子集合和测试子集合,包括:
获取时间序列;
根据所述时间序列,确定所述时间序列内的边缘点;
根据所述边缘点将所述时间序列分割为至少两个子序列;
根据所述子序列,通过随机取样的方式生成数据子集合;
根据所述子序列和所述数据子集合,获取剩余子序列;
根据所述剩余子序列生成测试子集合。
3.根据权利要求1所述的时间序列异常检测方法,其特征在于,所述将所述数据子集合进行切分,生成至少一个数据文本,包括:
将所述数据子集合中的子序列的每一数据维度进行特征表示,生成与所述数据维度数量对应的特征向量;所述特征向量中包括均值、最大值和最小值;
通过预设算法,将所述数据子集合切分为至少一个数据池;所述数据池内包括至少一个子序列;
根据预设格式和所述数据池,将所述维度与所述特征向量映射为所述数据文本。
4.根据权利要求3所述的时间序列异常检测方法,其特征在于,所述根据所述数据文本,生成对应数量的孤立树,包括:
根据所述数据文本,获取数据维度;
根据所述数据文本和所述数据维度,获取任一数据维度对应的分裂值区间;
根据所述数据维度和所述分裂值区间,将所述数据文本进行分裂;
根据所述分裂过程,生成孤立树;
多次迭代,直至所述孤立树达到预设的最大深度。
5.根据权利要求1所述的时间序列异常检测方法,其特征在于,所述根据所述孤立树,生成孤立森林,包括:
通过预设算法,将所述孤立树进行聚合,使所述孤立树的结果收敛,形成所述孤立森林。
6.根据权利要求1所述的时间序列异常检测方法,其特征在于,所述根据所述测试子集合和所述孤立森林,计算所述测试子集合中任一子序列的异常值,包括:
将所述测试子集合中子序列的每一数据维度进行特征表示,生成与所述数据维度数量对应的测试特征向量;
根据预设格式,将所述维度与所述测试特征向量映射为所述子序列的测试数据文本;
将所述测试数据文本中任一测试数据输入所述孤立森林,与所述孤立森林中每一节点的数据进行比较,获取与所述测试数据相等的节点的路径长度;
遍历所述路径长度,计算路径长度平均值;
当所述路径长度大于所述路径长度平均值时,将该路径长度对应的测试数据标记为异常数据,将所述路径长度与所述路径长度平均值的差值作为所述测试数据的异常值;
依次计算所述测试数据文本中每一测试数据的异常值,计算所述测试数据文本对应的子序列的异常值。
7.根据权利要求1所述的时间序列异常检测方法,其特征在于,还包括:
多次迭代,计算任一子序列的至少一个异常值;
根据所述任一子序列的至少一个异常值,计算任一子序列的平均异常值;
当所述任一子序列的平均异常值小于预设的异常值阈值时,判断所述子序列为正常子序列;
当所述任一子序列的平均异常值大于等于预设的异常值阈值时,判断所述子序列为异常子序列。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于天翼云科技有限公司,未经天翼云科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111613824.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种日志数据处理方法及装置
- 下一篇:一种索引建立的方法及装置、电子设备





