[发明专利]用于大数据的数据稳定性检测方法及装置、存储介质、服务器在审
申请号: | 201710705979.6 | 申请日: | 2017-08-17 |
公开(公告)号: | CN107577721A | 公开(公告)日: | 2018-01-12 |
发明(设计)人: | 汤奇峰;侯东东 | 申请(专利权)人: | 晶赞广告(上海)有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 北京集佳知识产权代理有限公司11227 | 代理人: | 张振军,吴敏 |
地址: | 200072 上海市闸北区灵*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 用于 数据 稳定性 检测 方法 装置 存储 介质 服务器 | ||
1.一种用于大数据的数据稳定性检测方法,其特征在于,包括:
基于历史数据得到按照时间序列排布的训练数据;
对所述训练数据进行拟合,以得到所述训练数据随时间的数据分布;
根据实际供应数据与所述数据分布的比较结果确定所述实际供应数据是否出现异常。
2.根据权利要求1所述的用于大数据的数据稳定性检测方法,其特征在于,所述基于历史数据得到按照时间序列排布的训练数据包括:按照时间序列提取所述历史数据中的数据,以得到时间序列数据;对所述时间序列数据进行清洗,以得到所述训练数据。
3.根据权利要求2所述的用于大数据的数据稳定性检测方法,其特征在于,所述对所述时间序列数据进行清洗,以得到所述训练数据包括:对所述时间序列数据进行对数变换,以得到变换后的数据;剔除所述变换后的数据中的异常数据,以得到所述训练数据。
4.根据权利要求3所述的用于大数据的数据稳定性检测方法,其特征在于,所述异常数据指的是:不在(QL-1.5IQR,QU+1.5IQR)范围内的数据,其中,QL表示所述变换后的数据的下四分点,QU表示所述变换后的数据的上四分点,IQR表示所述变换后的数据的四分位距,IQR=QU-QL。
5.根据权利要求1所述的用于大数据的数据稳定性检测方法,其特征在于,所述历史数据包括以下一项或多项:网站监测数据、软件开发工具包监测数据、离线业务数据、结构化查询语言数据、实时接口数据。
6.根据权利要求1所述的用于大数据的数据稳定性检测方法,其特征在于,所述对所述训练数据进行拟合,以得到所述训练数据随时间的数据分布包括:构建含有参数的多项式模型;基于所述训练数据,利用最小二乘法或者梯度下降法求解所述多项式模型的参数,以得到所述训练数据随时间的数据分布。
7.根据权利要求1所述的用于大数据的数据稳定性检测方法,其特征在于,所述根据实际供应数据与所述数据分布的比较结果确定所述实际供应数据是否出现异常包括:
构造所述数据分布在预设置信度下的置信区间;
如果所述实际供应数据落入所述置信区间,则判断所述实际供应数据正常,否则判断所述实际供应数据异常。
8.根据权利要求7所述的用于大数据的数据稳定性检测方法,其特征在于,还包括:图形显示以下一项或多项:所述数据分布、所述数据分布在预设置信度下的置信区间、所述实际供应数据和表示所述实际供应数据异常的标识。
9.一种用于大数据的数据稳定性检测装置,其特征在于,包括:
训练模块,适于基于历史数据得到按照时间序列排布的训练数据;
拟合模块,适于对所述训练数据进行拟合,以得到所述训练数据随时间的数据分布;
判断模块,适于根据实际供应数据与所述数据分布的比较结果确定所述实际供应数据是否出现异常。
10.根据权利要求9所述的用于大数据的数据稳定性检测装置,其特征在于,训练模块适于按照时间序列提取所述历史数据中的数据,以得到时间序列数据;对所述时间序列数据进行清洗,以得到所述训练数据。
11.根据权利要求10所述的用于大数据的数据稳定性检测装置,其特征在于,训练模块还适于对所述时间序列数据进行对数变换,以得到变换后的数据;剔除所述变换后的数据中的异常数据,以得到所述训练数据。
12.根据权利要求11所述的用于大数据的数据稳定性检测装置,其特征在于,所述异常数据指的是:不在(QL-1.5IQR,QU+1.5IQR)范围内的数据,其中,QL表示所述训练数据的下四分点,QU表示所述训练数据的上四分点,IQR表示所述变换后的数据的四分位距,IQR=QU-QL。
13.根据权利要求9所述的用于大数据的数据稳定性检测装置,其特征在于,所述历史数据包括以下一项或多项:网站监测数据、软件开发工具包监测数据、离线业务数据、结构化查询语言数据、实时接口数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于晶赞广告(上海)有限公司,未经晶赞广告(上海)有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710705979.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置