[发明专利]一种基于数据特征的时间序列流数据快速搜索方法有效
申请号: | 201810845200.5 | 申请日: | 2018-07-27 |
公开(公告)号: | CN109325060B | 公开(公告)日: | 2021-10-12 |
发明(设计)人: | 展鹏;蒯硕;李学庆;丁一明;胡宇鹏 | 申请(专利权)人: | 山东大学 |
主分类号: | G06F16/2458 | 分类号: | G06F16/2458 |
代理公司: | 济南金迪知识产权代理有限公司 37219 | 代理人: | 杨树云 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于数据特征的时间序列流数据快速搜索方法。包括:S1,参数预设:距离阈值DT;S2,对查询序列Q进行CSTP分割,并进行多级局部特征表示;S3,对时间序列流数据以滑动窗口的方式进行数据扫描,将滑动窗口内的子序列W进行多级局部特征表示;S4,对查询序列Q和窗口子序列W进行下界距离计算,若下界距离大于距离阈值DT,则忽略该片段,窗口继续滑动,否则,计算查询序列Q和窗口子序列W的实际距离,若实际距离大于距离阈值DT,则判定为不相似,否则,则判定为相似。本发明满足了时间序列流数据处理的一遍式扫描要求和实时响应要求。在保证搜索结果准确的前提下,减少了计算代价,节省了搜索计算时间。 | ||
搜索关键词: | 一种 基于 数据 特征 时间 序列 快速 搜索 方法 | ||
【主权项】:
1.一种基于数据特征的时间序列流数据快速搜索方法,其特征在于,包括步骤如下:S1,参数预设,包括范围搜索用到的距离阈值DT、对时序进行CSTP分割所用到的参数;对时序进行CSTP分割所用到的参数包括:单点最大数据拟合误差ME_SP、分段最大数据拟合误差ME_ES、转折点斜率变化参数μ、数据趋势点时间范围参数ρ;单点最大数据拟合误差ME_SP是指在某一数据段的所有数据点中与拟合直线的垂直距离最大的数据点;分段最大数据拟合误差ME_ES是指所有数据段中的拟合误差最大的数据段;转折点斜率变化参数μ是指在筛选数据趋势点时所指定的斜率变化门限值;数据趋势点时间范围参数ρ是指在筛选数据趋势点时所指定的时间范围门限值;S2,对查询序列Q进行CSTP分割,并进行多级局部特征表示;S3,对时间序列流数据以滑动窗口的方式进行数据扫描,扫描数据的同时,将滑动窗口内的子序列W进行多级局部特征表示,当前滑动窗口内包含的数据点序列为窗口子序列W;S4,对多级局部特征表示后的查询序列Q和窗口子序列W进行下界距离计算,若下界距离大于距离阈值DT,则忽略该片段,窗口继续滑动,否则,进入步骤S5;S5,计算查询序列Q和窗口子序列W的实际距离,若实际距离大于距离阈值DT,则判定为不相似,否则,则判定为相似,将窗口子序列W添加到结果集中。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东大学,未经山东大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810845200.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种数据比较方法及装置
- 下一篇:一种基于概率分布的异常数据处理方法及装置
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置