[发明专利]一种基于Geohash的二元电力时序数据索引构建方法在审

专利信息
申请号: 201710422732.3 申请日: 2017-06-07
公开(公告)号: CN107273471A 公开(公告)日: 2017-10-20
发明(设计)人: 周向东;王飞;庞悦;郭乃网;苏运;田英杰 申请(专利权)人: 国网上海市电力公司;华东电力试验研究院有限公司;复旦大学
主分类号: G06F17/30 分类号: G06F17/30
代理公司: 上海科盛知识产权代理有限公司31225 代理人: 赵志远
地址: 200002 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 基于 geohash 二元 电力 时序 数据 索引 构建 方法
【说明书】:

技术领域

发明涉及电力数据处理领域,尤其是涉及一种基于Geohash的二元电力时序数据索引构建方法。

背景技术

用户用电负荷数据是一种海量时间序列数据,具有用户规模大,数据采集密度高,与大量经济社会数据关联密切的特点。时间序列数据索引技术对减少数据查询与检索的时间代价,提升时间序列的挖掘效率(如分类、聚类、异常点监测、模式发现等等)至关重要。时间序列是按时间顺序排列的数据系列,根据时间序列包含的变量数量可以分为一元时间序列和多元时间序列。用户用电负荷数据包含日用电量、电压、电流等多元信息,因而用户用电负荷数据是一种多元时间序列数据。

面向相似查询的时间序列索引方法有基于空间划分的时间序列索引,基于特征压缩的多元时间序列索引和基于度量空间的多元时间序列索引等。

基于空间划分的时间序列索引,通常采用划分单元格的方式对原始空间进行编码,借助空间编码建立索引。Bakalov等提出时间序列索引方法TRSTJ,首先使用PAA方法对时间序列降维,然后将降维后的多元时间序列空间切分成相同大小的单元格,并为每个单元格分配一个符号,最终一条时间序列被表示成一个字符串。

基于特征压缩的多元时间序列索引,提取时间序列的特征并编码,借助特征编码建立索引。李正欣等提出一种多元时间序列索引方法,该方法将多元时间序列以多变量求和的方式转化为一元时间序列,使用PAA方法把一元时间序列变成N维向量,最后使用R树来索引该N维向量。

基于度量空间的时间序列索引,先选择若干参考点,定义某种距离,再计算所有时间序列相对于参考点的距离,最后在查询时通过这些参考点过滤掉不符合要求的时间序列。Kanishka等提出一种基于参考点距离的方法建立了多元时间序列索引LBS,在飞行数据集上进行相似性查询。

当前基于空间划分的方法保留了多元时间序列的大致信息,但基本上都是固定划分空间,对于索引而言,数据分布可能并不均匀,这样会导致查询效率降低。基于特征压缩的索引通过降维找到相似时间序列,但是通常无法保留原始多元时间序列信息。基于度量空间的索引运用三角不等式等下界过滤技术提高查询效率,但该类索引仍难以克服高维数据索引面临的“维灾问题”。

发明内容

本发明的目的就是为了克服上述现有技术存在的缺陷而提供一种动态划分、精度可指定、节点不重叠基于Geohash的二元电力时序数据索引构建方法。

本发明的目的可以通过以下技术方案来实现:

一种基于Geohash的二元电力时序数据索引构建方法,包括以下步骤:

1)获取原始二元电力时序数据,并对其进行降维;

2)对降维后的二元电力时序数据进行Geohash编码,获得二元电力时序数据的BTSAX表达;

3)根据BTSAX表达构建二元电力时序的BTSAX数据索引,并采用HBase数据库进行原始二元电力时序数据与二元电力时序数据索引的存储。

所述的步骤1)中,采用PAA模型将原始二元电力时序数据T={<f1,s1>,...,<fi,si>,...,<fn,sn>}进行降维获得降维后的二元电力时序数据其中,<fi,si>为第i个二元时间序列节点的第一个变量和第二个变量,n为原始二元电力时序的维度,为第j个降维后的二元电力时序节点的第一个变量和第二个变量,w为降维后的二元电力时序的维度。

所述降维的计算式为:

所述的步骤2)具体包括以下步骤:

21)将二元电力时序的第一、第二变量分别看做是二维空间中的经度和纬度变量。设置经度变量和纬度变量的最大值和最小值、编码总位数和空间分割基数;

22)采用二分法奇偶位交替存放编码,奇数位用以存放纬度变量,偶数为存放经度变量,直至全部编码总位数编码完毕;

23)获取Geohash二进制编码,依次排序获得二元电力时序数据的BTSAX表达。

所述的步骤3)中,BTSAX数据索引为多叉树和二叉树混合的树状结构,第一层为多叉树,从第二层开始进行二分裂,以第一层节点为根节点的子树为二叉树。

所述的步骤3)中,HBase数据库中包括原始二元电力时序数据和BTSAX数据索引。

与现有技术相比,本发明具有以下优点:

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国网上海市电力公司;华东电力试验研究院有限公司;复旦大学,未经国网上海市电力公司;华东电力试验研究院有限公司;复旦大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/201710422732.3/2.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top