[发明专利]一种融合趋势特征的时间序列符号聚集近似表示方法在审
申请号: | 201911407029.0 | 申请日: | 2019-12-31 |
公开(公告)号: | CN111143442A | 公开(公告)日: | 2020-05-12 |
发明(设计)人: | 余宇峰;万定生;朱跃龙;王继民;邓劲柏 | 申请(专利权)人: | 河海大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458;G06K9/62 |
代理公司: | 南京纵横知识产权代理有限公司 32224 | 代理人: | 董建林 |
地址: | 210024 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 融合 趋势 特征 时间 序列 符号 聚集 近似 表示 方法 | ||
1.一种融合趋势特征的时间序列符号聚集近似表示方法,其特征在于,包括以下步骤:
获取时间序列数据;
对时间序列数据进行预处理操作,得到预处理后的时间序列数据;
将预处理后的时间序列数据定长分割为w段子序列段;
提取子序列段的统计特征信息:采用符号聚集近似表示方法SAX对时间序列的统计特征信息进行符号化表示;
提取子序列段的趋势特征信息:分别计算子序列段的趋势距离因子和趋势形态因子,对时间序列的趋势特征信息进行符号化表示,并定义趋势字符间的距离度量;
融合趋势特征:将时间序列的趋势特征信息符号化表示方法融合进时间序列的符号聚集近似表示方法SAX中,获得新的时间序列表示方法TFSAX,并定义融合趋势特征的时间序列符号化距离度量。
2.根据权利要求1所述的一种融合趋势特征的时间序列符号聚集近似表示方法,其特征在于,提取子序列段的趋势特征信息具体包括以下方法:
子序列段趋势距离因子提取:对于给定的时间序列段Q,以Δq(ts)、Δq(te)分别表示时间序列段Q的起点值与时间序列段均值、终点值与时间序列段均值间的一阶差分,定义Δq(te)-Δq(ts)表征子序列段的趋势变化幅度,即趋势距离因子;
子序列段趋势形态因子提取:对于给定的时间序列段Q,计算Q中从一个趋势形态转换为另一个趋势形态的趋势点数量N作为表征序列趋势形态,即趋势形态因子;
趋势特征三角形构造:以趋势距离因子(Δp(te)-Δp(ts))为纵轴,趋势形态因子N为横轴构造趋势特征形态三角形,并以夹角θ表示趋势特征;所述趋势特征θ的计算公式如下:
时间序列的趋势特征信息符号化表示:根据子序列段的趋势特征θ,定义角度分位点,将分布空间划分成α个等概率区间,将时间序列趋势特征映射为趋势特征符号表示;
计算趋势字符间的距离度量:对时间序列的趋势特征信息进行符号化表示后,定义趋势特征符号之间的距离函数;趋势字符间的距离度量通过二维矩阵来描述,矩阵中第i行、第j列对应元素tfdist[i][j]的计算公式如下:
3.根据权利要求2所述的一种融合趋势特征的时间序列符号聚集近似表示方法,其特征在于,融合趋势特征具体包括以下方法:
融合趋势特征的符号聚集近似表示方法TFSAX:将两个序列长度都为n的时间序列段Q和C划分为w段,采用序列的统计特征信息和趋势特征信息共同表征时间序列;采用TFSAX表示方法对时间序列段Q和C的进行符号化表示结果为:
其中是时间序列段Q的统计特征信息符号化表示结果,是时间序列段Q的趋势特征信息符号化表示结果;是时间序列段C的统计特征信息符号化表示;是时间序列段C趋势特征信息符号化表示结果;
融合趋势特征的时间序列符号化距离度量:对给定长度均为n的时间序列段Q和C,采用TFSAX对时间序列段Q和C进行符号化表示后,则融合趋势特征的时间序列符号化距离度量表示为:
其中,分别表示序列段qi、ci的符号化表示,是qi、ci的SAX符号化距离,tfdist(qi,ci)为序列段qi、ci的趋势字符距离,n是序列长度。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河海大学,未经河海大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201911407029.0/1.html,转载请声明来源钻瓜专利网。