[发明专利]带有异常的时间序列数据生成方法、系统及存储介质在审
申请号: | 202110245171.0 | 申请日: | 2021-03-05 |
公开(公告)号: | CN112819386A | 公开(公告)日: | 2021-05-18 |
发明(设计)人: | 蔡志平;王承禹;周桐庆;余广 | 申请(专利权)人: | 中国人民解放军国防科技大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06F16/245 |
代理公司: | 长沙国科天河知识产权代理有限公司 43225 | 代理人: | 周达 |
地址: | 410073 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 带有 异常 时间 序列 数据 生成 方法 系统 存储 介质 | ||
本发明提供一种带有异常的时间序列数据生成方法、系统及存储介质,通过生成周期成分、噪声成分以及趋势成分,并将上述各成分通过加性模型或乘性模型组合成正常的时间序列数据;然后生成异常,并向正常的时间序列数据中注入异常,生成带有异常及异常标签的时间序列数据。本发明能够生成形状随机但频率,振幅,噪声的一到四阶中心矩,漂移程度等特性可控的时间序列数据,并且能够向正常时间序列数据中注入异常,且异常的位置,程度,类型可控,可以用来评估异常检测算法的性能。
技术领域
本发明属于智能运维中的KPI异常检测领域,更具体地,涉及一种带有异常及异常标注的时间序列数据生成方法,生成的时间序列数据可以用来搭建假设场景并评估异常检测算法的性能。
背景技术
提供基于互联网的服务的大型公司,需要密切监控其系统的实时性能,因为短暂的服务中断或质量下降可能会导致巨大的业务损失。这些实时性能数据(例如,搜索响应时间、CPU使用率)通常以时间序列的形式收集和存储,称为关键性能指标(KPI)。为了确保业务运营的顺利进行,这些公司通常会开发能够准确检测KPI异常并及时排除故障的异常检测系统。
检测KPI异常需要收集并标记KPI数据以在实际部署异常检测算法之前对其进行测试。与传统的时间序列数据(如天气或气候数据)不同,KPI数据要大得多,需要具有丰富经验的领域专家来进对异常进行标记。
尽管KPI很重要,但目前公开的,可供公众使用的KPI异常数据集却很少。造成这种现象的主要原因有两个:(1)手工标注KPI数据需要领域知识,并且需要大量时间成本。(2)出于隐私和安全考虑,大型公司不愿意发布KPI数据。对于第一个问题,即使用先进的辅助工具,标记一条时长为一年的KPI数据仍然需要几十分钟。乐观地预测,第一个问题可能最终在未来得到解决,但由于KPI数据的商业价值,第二个问题不太可能得到缓解。
公开的带异常标签的KPI数据的不足导致KPI异常检测存在以下问题:(1)评估不全面,致使KPI异常检测算法在一些公共数据集上可以取得很好的效果,但在生产环境中的性能可能不如预期。(2)很难搭建假设场景来评估算法在假设情况下的性能。从生产环境中收集的KPI数据是静态的,并且不包含某些罕见事件。如果不能在异常检测器部署之前搭建假设场景对其进行压力测试,很可能会忽视检测器的致命缺陷并最终导致严重的问题。
总之,KPI异常检测作为智能运维的主要功能之一,迫切需要一种能够生成具有各种特性的尤其是带有异常及异常标签的时间序列数据搭建假设场景对异常检测算法进行评估和压力测试以解决上述问题。
发明内容
为了解决上述问题,本发明提供了一种带有异常的时间序列数据生成方法、系统及存储介质。
为实现上述技术目的,本发明采用的技术方案是:
带有异常的时间序列数据生成方法,包括:
生成周期成分、噪声成分以及趋势成分,将上述各成分通过加性模型或乘性模型组合成正常的时间序列数据;
向正常的时间序列数据中注入异常,生成带有异常及异常标签的时间序列数据。
作为本发明的进一步限定,还包括将待评估检测算法在生成的带有异常及异常标签的时间序列数据上运行,并将待评估检测算法的性能得分统一进行排名,以衡量待评估检测算法的性能。
作为本发明的进一步限定,使用随机中点位移法生成周期成分。具体地,包含以下步骤:
(1)使用随即中点位移法生成单个周期的形状;
(2)通过随机中点位移分化法,根据第一个周期的形状来生成多个形状略有不同的周期。
(3)将每一个周期进行标准化,使其振幅为1,得到周期的表达式;
(4)根据用户指定的周期长度进行采样,对每个周期进行振幅和频率更改;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军国防科技大学,未经中国人民解放军国防科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110245171.0/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理