[发明专利]一种基于工业用电大数据的数据清洗的集成方法在审
申请号: | 202010400381.8 | 申请日: | 2020-05-13 |
公开(公告)号: | CN111582593A | 公开(公告)日: | 2020-08-25 |
发明(设计)人: | 洪蒙纳;满奕;胡雨沙;李继庚 | 申请(专利权)人: | 山东博依特智能科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06F16/215;G06F16/27;G06K9/62;G06Q50/06 |
代理公司: | 成都方圆聿联专利代理事务所(普通合伙) 51241 | 代理人: | 苟铭 |
地址: | 255039 山东省淄博市高新*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 工业 用电 数据 清洗 集成 方法 | ||
本发明公开了基于工业用电大数据的数据清洗的集成方法,包括下述步骤:S1、采集工厂需要进行数据清洗的数据序列;S2、对采集的数据序列进行周期性检验,将周期性检验后的数据细分为:周期性序列、非周期性平稳序列和非周期性非平稳序列;S3、建立异常值剔除模型库,并将不同类别数据序列分别输入到对应的剔除模型中,剔除异常值;S4、建立数据填补模型库,将剔除异常值的数据序列根据不同数据类别输入到对应的数据填补模型中;S5、建立滤波模型库,将填补后的数据序列分别输入到对应的滤波模型中;S6、将S5处理后的数据序列分别存入实时数据库和分布式数据库中。
技术领域
本发明涉及工业用电大数据的数据清洗领域,特别涉及一种基于工业用电大数据的数据清洗的集成方法。
背景技术
工业的电耗占了全社会用电的70%以上,为了实现到2030年中国单位GDP的二氧化碳排放,要比2005下降60%到65%。因此,减少工业用电是十分必要的。
为了减少工业用电,需要建立一系列的智能优化模型,而数据质量决定了优化模型的好坏,因此,保证数据质量是十分重要的。当前,工业对用电数据的采集点比其他的方面要全面,大型的工业对用电数据已经有了一定的沉淀。然而由于测量问题、通讯问题断、生产环境等原因,数据存在噪声、异常、空缺、失真等问题。因此,为了提高数据质量,需要对沉淀的工业用电大数据进行数据清洗。
本发明提出的一种基于工业用电大数据的数据清洗的集成方法,可以普遍用于各种大型工业的用电大数据的数据清洗,帮助提高数据质量,为后续建立用电优化模型提供可靠的保证。
发明内容
为解决现有技术中存在的问题,本发明提供了一种基于工业用电大数据的数据清洗的集成方法,解决了以往方法降低数据质量,无法为后续建立用电优化模型提供可靠的保证的问题。
本发明采用的技术方案是,一种基于工业用电大数据的数据清洗的集成方法,包括下述步骤:
S1、采集工厂需要进行数据清洗的数据序列;
S2、对采集的数据序列进行周期性检验,将周期性检验后的数据细分为:周期性序列、非周期性平稳序列和非周期性非平稳序列;
S3、建立异常值剔除模型库,并将不同类别数据序列分别输入到对应的剔除模型中,剔除异常值;
S4、建立数据填补模型库,将剔除异常值的数据序列根据不同数据类别输入到对应的数据填补模型中;
S5、建立滤波模型库,将填补后的数据序列分别输入到对应的滤波模型中;
S6、将S5处理后的数据序列分别存入实时数据库和分布式数据库中。
优选地,S2包括以下子步骤:
S21、利用小波分析法对部分序列进行拆分,分析拆分后的序列是否具有周期性,若没有,则分入非周期性这一类别中;若有,则分入周期性这一类别;
所述小波分析法的计算公式为:
其中,a为尺度,控制小波函数的伸缩;τ为平移量;f(t)为目标信号;ψ(t)为基本频率特性;
S22、对不是周期性序列进行统计学分析,分析一年的数据,且判断是否95%的数据都存在于一个固定范围内,若是,则将这类数据归类到非周期性、平稳序列中;若否,则归类到非周期性序列、非平稳序列中。
优选地,S3包括以下子步骤:
S31、利用主成分分析法对平稳生产的数据序列进行异常值标记和剔除,所述主成分分析法的计算公式为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于山东博依特智能科技有限公司,未经山东博依特智能科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010400381.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:模组连接器
- 下一篇:一种危险化学品液体非接触式转移装置
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置