[发明专利]多变量时间序列数据异常检测、模型训练方法和系统有效
申请号: | 202310531272.3 | 申请日: | 2023-05-12 |
公开(公告)号: | CN116304604B | 公开(公告)日: | 2023-08-18 |
发明(设计)人: | 乔焰;张本初;胡荣耀;赵培;袁新宇;魏振春 | 申请(专利权)人: | 合肥工业大学 |
主分类号: | G06F18/21 | 分类号: | G06F18/21;G06F18/24;G06F18/214;G06N3/0475;G06N3/088 |
代理公司: | 合肥和瑞知识产权代理事务所(普通合伙) 34118 | 代理人: | 金宇平 |
地址: | 230009 安*** | 国省代码: | 安徽;34 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 多变 时间 序列 数据 异常 检测 模型 训练 方法 系统 | ||
本发明涉及数据检测技术领域,尤其涉及一种多变量时间序列数据异常检测、模型训练方法和系统,解决了现有各类技术在多变量时间序列异常数据检测时,存在的受噪声影响大、检测效果不理想、无法实现实时检测的问题。本发明提出的一种多变量时间序列数据异常检测模型训练方法,额外增加了用以消除噪声影响的自适应权重和过滤模块,并采用对比学习的方法学习数据特征,以提升模型的泛化能力。本发明在异常检测阶段,着重考虑重构误差,并设计了用于评估数据异常程度的评价函数,本发明训练的异常检测模型具有更好的F1得分,展现模型在鲁棒性上显著超越了现有技术。
技术领域
本发明涉及数据检测技术领域,尤其涉及一种多变量时间序列数据异常检测、模型训练方法和系统。
背景技术
近年来,对多变量时间序列的异常检测在各领域逐渐突显出其重要性。多变量时间序列是由多个随时间变化的时间序列所组成的,每个时间序列描述了被监测对象的不同属性值。如航天器的遥感通道在连续时间内对温度、辐射、动力等属性的测量值,云服务器内部节点的CPU利用率、内存利用率等性能值。相对单变量时间序列数据,多变量时间序列能更全面地呈现对象特征。对多变量时间序列的异常检测是指检测出时间序列中不符合现实变化规律的数据片段,这些异常的数据段通常表明被监测对象正处于一种异常的工作状态,有时也代表某类异常事件的发生。若监测中的异常数据没有被及时发现并处理,则可能会导致巨大的经济损失甚至人员伤亡。因此,及时、准确地检测出多变量时间序列中的异常数据具有重要的现实意义。
随着机器学习技术的发展,基于机器学习的异常检测方法迅速涌现。这些方法主要分为基于聚类的异常检测方法、基于单分类的异常检测方法和基于重构的异常检测方法。其中基于聚类的异常检测方法和基于单分类的异常检测方法在检测高维度时间序列时都存在较高的时间复杂度,且无法保证检测准确度。近年来,基于重构的异常检测方法逐渐成为研究热点。此类方法大多采用自编码器(Autoencoder)模型,利用数据的重构误差进行异常检测。然而尽管此类方法能应用于高维度时间序列数据,但对于具有复杂分布的时间序列数据无法进行较好地重构,因而导致对复杂序列的异常检测准确度较低。随着生成对抗网络(GAN)的提出,基于生成性对抗网络(GAN)的异常检测方法在复杂数据的异常检测领域表现出更优的性能。
但是基于GAN的异常检测模型由于多变量时间序列分布的复杂性,样本对模型的训练较容易出现模式崩溃的问题。并且,由于现实中采集到的多变量时间序列不可避免地存在噪声干扰,这使得现有的异常检测模型难以准确捕获正常序列的分布,因而产生较高的误判率。
发明内容
针对现有技术中在多变量时间序列异常数据检测时,存在的对高维数据存在检测效果不理想、无法处理噪声干扰、无法实现实时检测的问题,本发明提出了一种多变量时间序列数据异常检测模型训练方法,该方法训练的异常检测模型在多变量时间序列数据的异常检测上具有很好的表现。
本发明采用以下技术方案:
一种多变量时间序列数据异常检测模型训练方法,包括以下步骤:
St1、获取学习样本,学习样本为多变量时间序列数据;构建基础模型并初始化;基础模型包括过滤模块、生成网络和鉴别网络,生成网络和鉴别网络均为神经网络;
生成网络的输入为输入数据x和随机数z,输入数据x为多变量时间序列数据,生成网络用于对随机数z进行重构,以获取并输出重构数据G(z),G(z)为与输入数据x同维度的数据;过滤模块用于清洗输入数据x和重构数据G(z),清洗后的输入数据记作x(a),清洗后的重构数据记作G#;x(a)中包含的数据样本和G#中包含的数据样本一一对应;鉴别网络用于获取数据元组(xq,x#q)的标签(yq,y-q),yq为数据样本xq来自于输入数据x的概率,y-q为数据样本x#q来自于输入数据x的概率;xq∈x(a),x#q∈G#,xq和x#q维度对应;
x=(x1,x2,x3,…,xi,…xn),xi表示输入数据x中第i个时间节点即维度上的数据样本,n为输入数据x的时间点总数,i为序数,1≦i≦n;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于合肥工业大学,未经合肥工业大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310531272.3/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种结合非临床数据的药物不良反应预测方法和系统
- 下一篇:铁路货车主阀装配线
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置