[发明专利]一种快速筛选大规模过程数据中的稳态工况数据的方法有效
申请号: | 201710227451.2 | 申请日: | 2017-04-10 |
公开(公告)号: | CN106997391B | 公开(公告)日: | 2020-11-03 |
发明(设计)人: | 董泽;尹二新 | 申请(专利权)人: | 华北电力大学(保定) |
主分类号: | G06F16/907 | 分类号: | G06F16/907 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 071000 河*** | 国省代码: | 河北;13 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 快速 筛选 大规模 过程 数据 中的 稳态 工况 方法 | ||
本发明公开了一种快速筛选大规模过程数据中的稳态工况数据的方法,包括:A、稳态数据筛选的初始化处理;B、滑动窗口由数据起点向终点移动,每移动一次,会有一个新数据点进入滑动窗口,同时将原滑动窗口内数据的起始点舍弃,计算新的滑动窗口内数据的均值和标准差;C、将所述新的滑动窗口内所含n个数据的标准差与标准差阈值δy进行比较,根据比较结果进行对应的筛选操作;D、对所选稳态数据段两端的数据进行剔除,提高数据稳态值的计算准确度。本发明能够改进现有技术的不足,提高了大规模过程数据的筛选速度。
技术领域
本发明涉及过程数据挖掘技术领域,尤其是一种快速筛选大规模过程数据中的稳态工况数据的方法。
背景技术
在过程数据模型辨识、系统稳定工况的参数判定等过程中,都需要应用过程数据中的稳态工况数据,对于大量的过程数据而言,人工筛选耗时费力。滑动窗口是一种通用性的数据统计处理方法,即通过一个固定长度的窗口对数据进行遍历处理。例如中国发明专利CN 103679218 B公开的一种手写体关键词检测方法,通过使用滑动窗口对待检测文本图像的特征点进行提取,进而与关键词特征库对比。但是现有技术中所使用的滑动窗口方法由于处理方法复杂,无法适应大数据量的快速处理。
发明内容
本发明要解决的技术问题是提供一种快速筛选大规模过程数据中的稳态工况数据的方法,能够解决现有技术的不足,提高了大规模过程数据的筛选速度。
为解决上述技术问题,本发明所采取的技术方案如下。
一种快速筛选大规模过程数据中的稳态工况数据的方法,包括以下步骤:
A、稳态数据筛选的初始化处理,
对需要进行稳态工况数据筛选的数据段进行数据滤波,
选取长度为n的存储空间作为滑动窗口,所述存储空间为判断所述过程数据段稳定的最小单元,其中n表示所述滑动窗口中包含数据的个数,
根据包含n个数据的滑动窗口中的单个数据允许偏差值α,计算所述滑动窗口中n个数据的标准偏差的阈值δy;
计算数据段起始位置的n个数据的均值,作为滑动窗口均值的初值
计算数据段起始位置的n个数据的标准差,作为滑动窗口标准差的初值σ1
B、滑动窗口由数据起点向终点移动,每移动一次,会有一个新数据点进入滑动窗口,同时将原滑动窗口内数据的起始点舍弃,计算新的滑动窗口内数据的均值和标准差;
C、将所述新的滑动窗口内所含n个数据的标准差与标准差阈值δy进行比较,若其小于所述标准差阈值δy,则将新加入的数据计入稳态数据;若其大于所述标准差阈值δy,对于新的滑动窗口,则新的滑动窗口内所含第n个数据赋0;若对于初始的滑动窗口其标准差大于所述标准差阈值δy,则初始的滑动窗口内所含n个数据全部赋0;设需要进行筛选的原始数据长度为N,则直至所述滑动窗口的起点移动至N-n+1后,筛选过程结束;
D、对所选稳态数据段两端的数据进行剔除,提高数据稳态值的计算准确度。
作为优选,步骤A中,标准差的阈值δy的计算方法为,
作为优选,步骤A中,滑动窗口均值的初值的计算方法为,
作为优选,:步骤A中,滑动窗口标准差的初值σ1的计算方法为,
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华北电力大学(保定),未经华北电力大学(保定)许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201710227451.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种食品用冷却传送设备
- 下一篇:定位分料载具机构