[发明专利]一种基于DTW的时间序列相似性预测方法在审

专利信息
申请号: 201611167179.5 申请日: 2016-12-16
公开(公告)号: CN106777980A 公开(公告)日: 2017-05-31
发明(设计)人: 陶洋;李鹏亮;熊炫睿;沈敬红 申请(专利权)人: 重庆邮电大学
主分类号: G06F19/00 分类号: G06F19/00
代理公司: 北京同恒源知识产权代理有限公司11275 代理人: 廖曦
地址: 400065 *** 国省代码: 重庆;85
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 dtw 时间 序列 相似性 预测 方法
【说明书】:

技术领域

发明属于数据挖掘技术领域,特别是时间序列数据挖掘技术领域,涉及一种基于DTW的时间序列相似性预测方法。

背景技术

动态时间规整(Dynamic Time Warping,DTW)是时间序列的一个强大的相似性度量方法。虽然我们常见的欧氏距离计算简单、容易理解,但它要求两条时间序列的长度必须相等,且对时间轴伸缩和弯曲问题无能为力。DTW距离定义了序列之间的最佳对齐匹配关系,支持不同长度时间序列的相似性度量,支持时间轴的伸缩和弯曲。由于DTW距离比欧式距离有更好的鲁棒性,因此被广泛用于时间序列的相似性度量,这是很多时间序列数据挖掘问题的基础,比如分类和聚类以及预测等。然而,DTW的时间和空间复杂度较高,导致基于DTW的数据挖掘效率很低。因此,如何降低DTW时空复杂度成为了当前的研究重点和难点。

DTW最早是用于语音识别中的一项技术,目前在金融、生物、化学以及机器人等领域都有广泛的应用,特别是在多媒体数据领域。目前,对DTW进行加速的方法主要有以下两种:1)添加全局约束。这种方法的目的是对DTW中的规整路径进行全局约束,即限定一个序列中的点只能同另一序列中位置相近的某些点进行匹配。然而,该方法由于只针对查询空间进行约束,并未从实质上降低DTW方法的复杂度,且在查询时,由于查询范围的限制,存在误报情况。2)利用下界距离进行过滤。该方法的主要思想是寻找一种计算更简单的距离度量来粗略地估计DTW距离,称为DTW下界距离,通过它可以过滤掉大部分不满足相似性要求的序列,从而提高查询效率。然而,该类方法,如果下界距离选取复杂度较高,则会降低整体查询效率;如果下界距离选取比较简单,又会降低过滤效果,增大候选集,产生误报。

传统的时间序列分析预测方法将时间序列数据匹配到某些数学模型中,然后再对其整体进行分析和预测。但这些数据模型往往对数据有必要的限制,而现实中许多数据不能满足模型参数要求。基于时间序列相似性的类比合成方法是一种典型的非参数回归方法,其非参数回归特性使得它能够很好的规避上述问题,所以该方法日渐成为时间序列预测领域的研究焦点,然而,传统的类比合成方法在选取距离度量方法时,大多使用的是欧式距离,由于该方法不能处理时间序列的伸缩,平移等。所以,利用该方法得到的相似序列具有一定的局限性,其用于后期合成预报的参考模式数据质量不高,从而会影响后期预测的准确性。

因此,如何综合考虑下界距离复杂度与下界距离过滤能力,从而实现时间序列快速而且准确的查询,进而将其应用到类比合成预测方法中目前来说很少有人进行研究,但具有重要的研究意义。

发明内容

有鉴于此,本发明的目的在于提供一种基于DTW的时间序列相似性预测方法,该方法将目前已知的对DTW进行加速的方法,如LB_Kim、LB_Keogh、逆LB_Keogh和传统的DTW方法等进行级联,在不同阶段利用不同方法对查询集进行过滤。同时,为了提高查询准确性,我们引入z-score标准化,在计算DTW距离之前对查询序列进行标准化,在读取数据的过程中,同步进行标准化,进一步提高算法效率。然后,将改进的DTW方法应用到时间序列的类比合成预测方法中,从而提高预测的速度与精度。

为达到上述目的,本发明提供如下技术方案:

一种基于DTW的时间序列相似性预测方法,该方法包括以下步骤:

S1:生成类比模式和参考模式:假设一个一维时间序列为T={x1,x2,…,xm,…xm+k},先假定已有合适的模式长度k,则生成类比模式C={x1,x2,…,xm}和参考模式Q={xm+1,xm+2,…,xm+k},其中类比模式为时间序列T中的历史数据,参考模式为时间序列最近的发展趋势;

S2:构造类比模式C的封带,所述封带指的是利用全局约束条件得到序列的上下边界,其边界所包含的部分;对C进行z-score标准化,z-score标准化是基于原始数据的均值(mean)和标准差(standard deviation)进行数据的标准化,定义如下:

其中,x为X中的数据点,μ为X的均值,σ为X的标准差;选择z-score标准化的原因是利用z-score标准化方法得到的标准化时间序列的形状与原始时间序列较为接近,因此其经常被用于时间序列数据挖掘任务中。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于重庆邮电大学,未经重庆邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201611167179.5/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top