[发明专利]一种相似性时间序列搜索的方法和装置在审
申请号: | 201410430784.1 | 申请日: | 2014-08-28 |
公开(公告)号: | CN104166727A | 公开(公告)日: | 2014-11-26 |
发明(设计)人: | 周敏;胡浩;谢蔚;刘绍敏;陈鹏;王文豹;王媛;倪华 | 申请(专利权)人: | 北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 中原信达知识产权代理有限责任公司 11219 | 代理人: | 刘光明;陆锦华 |
地址: | 100195 北京市海淀区杏石口路6*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 相似性 时间 序列 搜索 方法 装置 | ||
技术领域
本发明涉及一种相似性时间序列搜索的方法和装置。
背景技术
随着现代科技的发展,数据的存储能力飞速增强,使得更多的数据得以保存起来,在与人们生活息息相关的各行业中涌现出各类海量数据。时间序列数据就是这样的数据,按照固定的时间间隔收集并存储。比如股市数据、气温变化数据、心跳变化数据等。对这些数据进行分析,可揭示出事物变化、发展规律,为科学决策提供帮助。时间序列数据是数据挖掘的基础之一,相似性时间序列的搜索技术对于时间序列数据挖掘变得越来越重要。时间序列具有数据维度高的特性,使得时间序列的挖掘具有比较高的难度。时间序列的相似性搜索是时间序列数据挖掘的一种重要手段。
现有时间序列相似性技术,多采用形态学匹配计算欧式距离,即比对两个时间序列曲线的形状。欧式距离越小则越相似。这种技术着重于形态学上的匹配,局限于微观的数值比较,从而限制了现有时间序列相似性搜索的范畴。对于超越了形态学的相似性比较,特别是数据在一定程度的宏观的属性的比较,现有技术很难满足需求。另外,现有时间序列相似性搜索技术参与计算的维度很高,这会引入计算误差问题和计算量代价高的问题。
发明内容
有鉴于此,本发明提供一种相似性时间序列搜索的方法和装置,能够实现数据的宏观状态的比较并且有较高的计算效率。
为实现上述目的,根据本发明的一个方面,提供了一种相似性时间序列搜索的方法。
本发明的相似性时间序列搜索的方法包括:按预设的状态集,将多个对象的目标时间序列数据转换为目标状态序列数据;将状态描述序列与所述目标状态序列数据进行匹配,在所述目标状态序列数据中有连续的数据与所述状态描述序列中的全部描述项匹配成功的情况下,输出所述连续的数据所属的对象的标识。
可选地,所述状态描述序列中的各个描述项包括状态名、匹配方式、最小计数限制条件、以及最大限制计数条件,其中:所述状态名用于指定所在描述项涉及的状态,描述项中状态名为空表示任意状态;所述匹配方式用于指定在将本描述项中的状态名与所述目标状态序列数据进行匹配时的匹配方式,包括直接匹配和取非匹配,其中所述状态名与目标状态序列数据中的状态名一致时表示对状态名直接匹配成功,对所述状态名所表示的状态进行取非之后得到的状态包含了目标状态序列数据中的状态名时表示对状态名取非匹配成功;所述最小计数条件用于指定所在描述项涉及的状态的最短持续时间,在目标状态序列数据中的状态持续时长大于该最短持续时间的情况下表示最小计数条件匹配成功,所述最小计数条件为空表示目标状态序列数据中的状态持续时长为任意值时最小计数条件都匹配成功;所述最大计数条件用于指定所在描述项涉及的状态的最长持续时间,在目标状态序列数据中的状态持续时长小于该最短持续时间的情况下表示最大计数条件匹配成功,所述最大计数条件为空表示目标状态序列数据中的状态持续时长为任意值时最大计数条件都匹配成功。
可选地,所述对象是商品,所述时间序列数据是各种商品各自的日销量。
根据本发明的另一方面,提供了一种相似性时间序列搜索的装置。
本发明的相似性时间序列搜索的装置包括:数据转换模块,用于按预设的状态集,将多个对象的目标时间序列数据转换为目标状态序列数据;匹配输出模块,用于将状态描述序列与所述目标状态序列数据进行匹配,在所述目标状态序列数据中有连续的数据与所述状态描述序列中的全部描述项匹配的情况下,输出所述连续的数据所属的对象的标识。
可选地,所述状态描述序列中的各个描述项包括状态名、匹配方式、最小计数限制条件、以及最大限制计数条件,其中:所述状态名用于指定所在描述项涉及的状态,描述项中状态名为空表示任意状态;所述匹配方式用于指定在将本描述项中的状态名与所述目标状态序列数据进行匹配时的匹配方式,包括直接匹配和取非匹配,其中所述状态名与目标状态序列数据中的状态名一致时表示对状态名直接匹配成功,对所述状态名所表示的状态进行取非之后得到的状态包含了目标状态序列数据中的状态名时表示对状态名取非匹配成功;所述最小计数条件用于指定所在描述项涉及的状态的最短持续时间,在目标状态序列数据中的状态持续时长大于该最短持续时间的情况下表示最小计数条件匹配成功,所述最小计数条件为空表示目标状态序列数据中的状态持续时长为任意值时最小计数条件都匹配成功;所述最大计数条件用于指定所在描述项涉及的状态的最长持续时间,在目标状态序列数据中的状态持续时长小于该最短持续时间的情况下表示最大计数条件匹配成功,所述最大计数条件为空表示目标状态序列数据中的状态持续时长为任意值时最大计数条件都匹配成功。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司,未经北京京东尚科信息技术有限公司;北京京东世纪贸易有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410430784.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种含草酸二丙酮胺铜的杀菌组合物
- 下一篇:吡唑醚菌酯纳米微球及其制备方法