[发明专利]一种基于L∞准则的半连续最优分段线性近似方法在审
申请号: | 201711178360.0 | 申请日: | 2017-11-23 |
公开(公告)号: | CN107994906A | 公开(公告)日: | 2018-05-04 |
发明(设计)人: | 黎彤亮;赵环宇;李晓云;庞超逸 | 申请(专利权)人: | 河北省科学院应用数学研究所 |
主分类号: | H03M7/30 | 分类号: | H03M7/30;G06F17/17 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 050000 河北省石家庄*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 准则 连续 最优 分段 线性 近似 方法 | ||
技术领域
本发明涉及一种基于L∞准则的半连续最优分段线性近似方法。
背景技术
对于时序序列数据,一个好的压缩方法可以极大的降低数据存储量、加快数据传输、甚至能够提高查询效率。分段线性近似可以极大的压缩时间序列数据。目前,在L∞准则下构建最优的连续线段近似技术尚未提出。Xie等人尽管已经提出了最优的非连续线段近似算法,并且Xie和Zhao等人也讨论了最优的连续线段近似算法,但是这些已有的技术难以直接用来构建一个最优的分段线性近似算法,即最优的 PLA算法。
早期的研究大多集中于目标A,即要求压缩后的分段的个数在给定的量值内,并极小化均值误差或最大误差。Bellman Richard提出了一个对在线时序序列进行的最优动态规划近似算法[1]。由于使用动态规划方法,因此算法的时间复杂度较高,为O(kn2),其中k是线段的个数,n是整个时序数列的长度。该算法对于大数据处理是非常耗时的。因此有人提出了一些启发式的策略来提高数据处理的效率。比如,滑动窗口(SW)算法就可以有效的处理在线数据[2]。SW算法的主要思想是(1)通过连续时序数列的第一个点和第二个点来初始化近似直线,并计算所有点和当前直线垂直方向上近似误差;(2)通过重新计算下一个数据点的近似误差来调整近似直线;(3)如果近似误差超过了预定义的误差,就终止当前的分段并开始构建一个新的分段;(4)重复上面的步骤,直到所有的点都被处理过。为了降低SW的损失,Keogh 等人提出了结合从底到上策略与SW的混合算法[3],Palpanas等人给出了一个线性的算法[4]。
事实上,流数据是无界的。因此目标A不能产生误差保证的替代。除此之外,L2准则不能够保证每一点的近似误差都在给定范围内,因此目标A在许多应用方面是有缺陷的。基于目标B的线性分段压缩算法成为基于最大误差的PLA算法(L∞-有界的PLA),可以保证每一点重构的误差有界。Liu等人提出了一个FSW算法[5],这个算法是利用固定的空间窗从一个固定的初始点构造线段。Qi等人将其扩展到了多维数据上[6]。Xie等人给出了一个优化的线性算法OptimalPLR[7],该算法在本专利中称作DisConnAlg算法,该算法构建了一个最少数量的非连续线段的数据近似,在这个算法中,最少的线段个数是通过最大化的延长当前的线段来实现的。Xie等人还指出DisConnAlg的思想可以用来构建连续的线段,这个用来构建连续线段的算法被称作DConnAlg。近期为了最小化连续线段的个数,Zhao等人提出了对时序数据近似的一个线性算法[8],称作ConnSegAlg。为了使每一段最长化,这个算法结合了前向-检查策略并设计了后向-检查策略,该算法优于FSW算法和 DConnAlg算法。
参考文献:
1.Bellman R.On the approximation of curves by line segments using dynamic programming[J].Archives of Internal Medicine, 1961,4(6):284.
2.Appel U,Brandt A V.Adaptive sequential segmentation of piecewise stationary time series.[J].Information Sciences, 1983,29(1):27-56.
3.Keogh E,Chu S,Pazzani M.An Online Algorithm for Segmenting Time Series[C]//IEEE International Conference on Data Mining. IEEE,2002:289-296.
4.Palpanas T,Vlachos M,Keogh E,et al.Streaming Time Series Summarization Using User-Defined Amnesic Functions[J].IEEE Transactions on Knowledge&Data Engineering,2007, 20(7):992-1006.
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于河北省科学院应用数学研究所,未经河北省科学院应用数学研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711178360.0/2.html,转载请声明来源钻瓜专利网。
- 上一篇:模数转换电路及流水线模数转换器
- 下一篇:一种生成压缩字典的方法及装置