[发明专利]一种基于变换分类的时间序列异常检测方法在审
| 申请号: | 202111561819.1 | 申请日: | 2021-12-20 |
| 公开(公告)号: | CN114510958A | 公开(公告)日: | 2022-05-17 |
| 发明(设计)人: | 陆豪;张凤斌;樊好义 | 申请(专利权)人: | 哈尔滨理工大学 |
| 主分类号: | G06K9/00 | 分类号: | G06K9/00;G06N3/04;G06N3/08;A61B5/346 |
| 代理公司: | 暂无信息 | 代理人: | 暂无信息 |
| 地址: | 150080 黑龙*** | 国省代码: | 黑龙江;23 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 变换 分类 时间 序列 异常 检测 方法 | ||
本发明设计一种基于变换分类的时间序列异常检测方法,通过将基于分类的方法以自监督方式扩展到异常检测领域,通过对正常数据进行训练,学习到数据的正常模式,从而在测试时检测到输入数据中的异常。具体的,本发明将使用适用于时间序列数据的变换方法,对时序数据进行多种变换,将变换后的数据通过深度一类分类的方法映射到超球体特征空间中,通过优化超球体的中心和半径,使模型学到正常数据的鲁棒表示,然后通过预测正确变换的概率算出数据的异常评分,进而判断异常。针对于目前时序异常检测领域存在的未充分考虑时间关系、标记数据缺乏、难以处理高维数据等问题,本发明的主要贡献包括:使用适用于时间序列数据领域的变换,使模型可以学习到带有时间关系的鲁棒表示;通过自动生成数据标签,以自监督的方式来训练模型,利于在标记数据缺乏的场景下进行异常检测;通过使用深度一类分类的方法,而不是传统的机器学习方法,使模型可以对高维的时序数据进行异常检测。
技术领域
本发明涉及时间序列异常检测方法技术领域,尤其涉及一种基于变换分类的时间序列序列异常检测方法。
背景技术
信息时代伴随着数据的爆炸式增长,形式各异的数据在人类社会与因特网之间流动不息,时间序列数据便是其中一种最重要的数据形式。在金融、交通、互联网、医学等领域中时间相关的数据无处不在,发现时序数据中的特征和趋势的需求正日益增长,而其中一个重要任务就是时序异常检测,异常检测的目的是找到某些观察结果,它与其他的观察结果有很大的偏差,这样的偏差很有可能是由于不同的原因或机制所产生的。对应到不同的领域中,网络安全中的异常表示网络设备异常或者可疑的网络状态。医学信息中的异常表示身体状况的反常这些异常信息或模式。识别这些异常有助于及时认清实际状况,找出产生原因,进一步分析解决问颗。
异常检测有很多的方法,一些最常见的异常检测方法是基于重构的,这种方法的基本思想是,每个正常样本都应该使用有限的一组基函数进行准确的重构,而异常数据的重构成本更大。特征、基和损失函数的选择区别于不同的方法。此外,一些方法使用神经网络学习深层基函数进行重构。另一组最近的方法使用GAN学习重构基函数,但GAN具有模态崩溃和反转困难的特点,限制了该方法的性能。另一组常用的方法是基于分布的,这些方法的主要是对正常数据的分布建模,期望异常测试数据在概率模型下具有较低的可能性,而正常数据具有较高的可能性。另一组方法使用非参数密度估计方法,如核密度估计。最近,深度学习方法如自编码器或变分自编码器用于学习深度特征,这些特征有时比原始特征更容易建模。另一种基于分类的方法是将包含正常数据的空间区域与所有其他区域分离,通过训练一个分类器来执行这种分离,通过这种方法学习一个好的特征空间来执行这样的分离的有经典的核方法和最近的一些深度学习方法。
以往的异常检测方法往往忽略了时序数据的时间关系,导致时序数据的异常检测准确率低下,并且现实中有标记的异常数据的获取是困难的,所以异常检测的方法通常是无监督的,无监督学习的主要挑战之一是为学习与感兴趣的任务相关的特征提供一个目标,一种以自监督的方式学习好的表示的方法是通过训练神经网络来解决一个辅助任务。在以往基于分类的方法中,往往是用于有监督领域,缺乏在无监督领域的分类方法。在本发明中,我们克服了以往基于分类方法的一些局限性,并使用适用于时序数据变换将自监督方法的适用性扩展到时序数据类型。
发明内容
本发明设计一种基于变换分类的时间序列异常检测方法,通过将基于分类的方法以自监督方式扩展到异常检测领域,通过对正常数据进行训练,学习到数据的正常模式,从而在测试时检测到输入数据中的异常。具体的,本发明将使用适用于时间序列数据的变换方法,对时序数据进行多种变换,将变换后的数据通过深度一类分类的方法映射到超球体特征空间中,通过优化超球体的中心和半径,使模型学到正常数据的鲁棒表示,然后通过预测正确变换的概率算出数据的异常评分,进而判断异常。针对于目前时序异常检测领域存在的未充分考虑时间关系、标记数据缺乏、难以处理高维数据等问题,本发明的主要贡献包括:使用适用于时间序列数据领域的变换,使模型可以学习到带有时间关系的鲁棒表示;通过自动生成数据标签,以自监督的方式来训练模型,利于在标记数据缺乏的场景下进行异常检测;通过使用深度一类分类的方法,而不是传统的机器学习方法,使模型可对高维的时序数据进行异常检测。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨理工大学,未经哈尔滨理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111561819.1/2.html,转载请声明来源钻瓜专利网。





