[发明专利]一种基于时序匹配和双向四分位算法的异常数据清洗方法在审
申请号: | 202210565276.9 | 申请日: | 2022-05-23 |
公开(公告)号: | CN114968999A | 公开(公告)日: | 2022-08-30 |
发明(设计)人: | 邹祖冰;乔延辉;王罗;韩爽;孙长平;刘永前;李梦杰;刘杰;张美俊;汤维贵 | 申请(专利权)人: | 中国长江三峡集团有限公司;华北电力大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F16/2458 |
代理公司: | 北京众合诚成知识产权代理有限公司 11246 | 代理人: | 张文宝 |
地址: | 430010 *** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 时序 匹配 双向 四分位 算法 异常 数据 清洗 方法 | ||
本发明公开了属于风电机组发电技术领域的一种基于时序匹配和双向四分位算法的异常数据清洗方法。该方法包括以下步骤:步骤1:采集风电机组的实测风速和风电功率数据;步骤2:辨识风电机组限功率异常数据;具体包括:步骤21:采用基本趋势转折点和重要趋势转折点确定算法对风电功率时间序列进行分段划分;步骤22:基于风速‑风电功率时序匹配度量对限功率分段时间序列进行筛选;步骤23:基于额定功率剔除系数对额定功率分段时间序列进行剔除;步骤3:利用双向四分位算法清洗风电功率分散型异常数据。本发明能够同时有效地清洗堆积型异常数据和分散型异常数据,且可以有效辨识过渡区域内与正常数据空间分布特征相似的异常运行数据。
技术领域
本发明涉及风力发电技术领域,尤其涉及一种基于时序匹配和双向四分位算法的异常数据清洗方法。
背景技术
受风电机组停机、限电、通信噪声和设备故障等多种因素的影响,采集的风电机组实测数据通常含有大量复杂的异常运行数据,无法直接用于风电场运维效能评价、风电功率预测、风电机组发电能力评估及运行状态监测,通常需要先进行风电机组异常运行数据清洗。但是,现有风电机组异常运行数据清洗算法通常是基于离散数据的空间分布特征展开,忽略了运行数据的时序特性,无法有效辨识与正常数据空间分布特征相似的异常运行数据;且对于存在大量堆积型限电数据样本,传统的数据清洗方法无法有效识别过渡区域数据类别,容易造成正常数据的错删和异常数据的漏删问题。针对现有技术的不足,本发明提供一种基于时序匹配和双向四分位算法的异常数据清洗方法,同时适用于堆积型异常数据和分散型异常数据清洗,且能够有效辨识过渡区域内与正常数据空间分布特征相似的异常运行数据。
发明内容
本发明的目的是提出一种基于时序匹配和双向四分位算法的异常数据清洗方法,其特征在于,包括以下步骤:
步骤1:采集风电机组的实测风速和风电功率数据;
步骤2:利用风速-风电功率时序匹配算法辨识风电机组限功率异常数据;具体包括:
步骤21:采用基本趋势转折点和重要趋势转折点确定算法对风电功率时间序列进行分段划分;
步骤22:基于风速-风电功率时序匹配度量对限功率分段时间序列进行筛选;
步骤23:基于额定功率剔除系数对额定功率分段时间序列进行剔除;
步骤3:利用双向四分位算法清洗风电功率分散型异常数据。
所述步骤21中的基本趋势转折点定义如下:
基本趋势转折点分为上升趋势转折点和下降趋势转折点;设风电功率的时间序列为P=P1,P2,…,Pn,若第t时刻的风电功率Pt满足Pt-1≥Pt<Pt+1或Pt-1>Pt≤Pt+1,则风电功率Pt为上升趋势转折点;若第t时刻的风电功率Pt满足Pt-1≤Pt>Pt+1或Pt-1<Pt≥Pt+1,则风电功率Pt为下降趋势转折点。
所述步骤21中的重要趋势转折点定义如下:
对于风电功率时间序列基本转折点序列一个重要趋势转折点PIT与两个连续的基本趋势转折点和构成的最小模式序列中,是否为重要趋势转折点,取决于到PIT和线段的垂直距离D,垂直距离D越大,越有可能是重要趋势转折点。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国长江三峡集团有限公司;华北电力大学,未经中国长江三峡集团有限公司;华北电力大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210565276.9/2.html,转载请声明来源钻瓜专利网。