[发明专利]数据处理方法及系统在审
申请号: | 202110194372.2 | 申请日: | 2021-02-20 |
公开(公告)号: | CN112883019A | 公开(公告)日: | 2021-06-01 |
发明(设计)人: | 姜孝谟;成骁彬;林琳;赵海心;马明骏;唐伟健;陈庆;惠怀宇 | 申请(专利权)人: | 上海电气风电集团股份有限公司;大连理工大学 |
主分类号: | G06F16/215 | 分类号: | G06F16/215;G06F30/20;G06Q10/04;G06Q50/06 |
代理公司: | 北京博思佳知识产权代理有限公司 11415 | 代理人: | 吴梅英 |
地址: | 200241 上海*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 数据处理 方法 系统 | ||
本申请提供一种数据处理方法及系统,数据处理方法包括:获取SCADA数据集中的至少部分数据,作为待处理数据集,待处理数据集包括多个数据组,每个数据组包括同一时刻下的风速数据和对应的输出功率数据;采用四分位数法对待处理数据集进行数据清洗,得到中间数据集;根据风力发电机组的切入风速Vmin、切出风速Vmax和额定风速Vr,将中间数据集划分为两个子数据集,其中一个子数据集的风速数据的范围为[Vmin,Vr),另一个子数据集的风速数据的范围为[Vr,Vmax];采用bin算法对子数据集进行数据清洗。本申请可提升SCADA数据的质量。
技术领域
本申请涉及风力发电机领域,尤其涉及一种数据处理方法及系统。
背景技术
风力发电机组数据的质量,直接决定了模型的预测和泛化能力的好坏,其涉及很多因素,如准确性、完整性、一致性、时效性、可信性和解释性。风力发电机组SCADA系统在实际生产中获取的数据中,可能包含了大量的缺失值、噪音等异常数据,也可能因为人工录入错误导致有异常数据存在,非常不利于监测预警等模型的训练与开发。因此,如何在风力发电机组的数据分析中对上述异常数据进行清洗,以消除SCADA数据的波动,提升SCADA数据的质量,是本领域亟待解决的问题。
发明内容
本申请提供一种数据处理方法及系统。
具体地,本申请是通过如下技术方案实现的:
根据本申请实施例的第一方面,提供一种数据处理方法,用于处理SCADA系统采集的风力发电机组的SCADA数据集,包括:
获取所述SCADA数据集中的至少部分数据,作为待处理数据集,所述待处理数据集包括多个数据组,每个数据组包括同一时刻下的风速数据和对应所述风速数据的所述风力发电机组的输出功率数据;
采用四分位数法对所述待处理数据集进行数据清洗,得到中间数据集;
根据所述风力发电机组的切入风速Vmin、切出风速Vmax和额定风速Vr,将所述中间数据集划分为两个子数据集,其中一个子数据集的风速数据的范围为[Vmin,Vr),另一个子数据集的风速数据的范围为[Vr,Vmax];
采用bin算法对所述子数据集进行数据清洗,得到已处理数据集。
可选地,所述采用四分位数法对所述待处理数据集进行数据清洗,得到中间数据集,包括:
采用四分位数法确定所述待处理数据集中的异常风速数据;
去除所述异常风速数据和包括该异常风速数据的数据组的其他数据,得到中间数据集。
可选地,所述方法还包括:
将所述输出功率数据划分成多个功率数据组,获得每个功率数据组的输出功率数据及对应的风速数据;
所述采用四分位数法确定所述待处理数据集中的异常风速数据,包括:
采用四分位数法分别确定多个所述功率数据组对应的风速数据中的异常风速数据。
可选地,所述采用四分位数法分别确定多个所述功率数据组对应的风速数据中的异常风速数据,包括:
采用四分位数法分别确定多个所述功率数据组中的风速数据的内限风速范围;
根据所述内限风速范围,确定所述功率数据组对应的风速数据中的异常风速数据。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海电气风电集团股份有限公司;大连理工大学,未经上海电气风电集团股份有限公司;大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110194372.2/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种电子设备及调节方法
- 下一篇:一种变速箱油加注器