[发明专利]基于决策树分类的辐照度数据插补方法及系统在审
申请号: | 202011065113.1 | 申请日: | 2020-09-30 |
公开(公告)号: | CN112132228A | 公开(公告)日: | 2020-12-25 |
发明(设计)人: | 张侃健;陈昕怡;刘奕男;谢利萍;方仕雄;张金霞;葛健;魏海坤 | 申请(专利权)人: | 东南大学 |
主分类号: | G06K9/62 | 分类号: | G06K9/62;G06N3/04;G06N3/08 |
代理公司: | 南京众联专利代理有限公司 32206 | 代理人: | 叶涓涓 |
地址: | 211189 *** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 决策树 分类 辐照 度数 据插补 方法 系统 | ||
本发明提供了一种基于决策树分类的辐照度缺失数据插补方法及系统,其中方法包括以下步骤:检测缺失的辐照度值;运用决策树分类的方法将数据按天气分类;根据日期、时间、经纬度计算太阳高度角;在不同的天气类别下,根据当前时间、功率和环境温度,运用不同的神经网络参数拟合辐照度序列;插补缺失的辐照度值。本发明通过决策树的分类保留了天气现象的信息,又在神经网络中加了太阳高度角的输入,保留了日期和时间的信息,因此数据插补效果明显优于其他算法,大大提高了插补的准确度。本发明有助于填补缺失的辐照度数据,在不降低性能的前提下,解决辐照度、温度、功率时间戳不一致的问题,有助于增加样本数量。
技术领域
本发明属于数据处理技术领域,涉及序列预测技术,具体涉及一种基于决策树分类的辐照度缺失数据插补方法及系统。
背景技术
一般地,在数据预处理时,会挑选各项序列都完整的数据来训练,若存在部分缺失的数据,将会删除整条数据记录,导致丢失了很多数据信息。因此缺失数据的插补问题,备受关注,它不仅可以提高序列完整度,便于后续的数据处理工作,而且可以通过插补,来有效的解决不同类型数据时间戳不一致的问题。然而现有的缺失数据插补方法大多只从单个序列角度出发,挖掘序列的规律信息来插补,导致数据插补的准确度较低,反而会给原始数据带来更多的干扰,难以实际应用。
发明内容
为解决上述问题,本发明提供一种准确度较高的基于决策树分类的辐照度缺失数据插补方法及系统,满足实际应用需求。
为了达到上述目的,本发明提供如下技术方案:
基于决策树分类的辐照度缺失数据插补方法,包括如下步骤:
S1:检测辐照度序列中缺失的辐照度值;
S2:将辐照度序列运用决策树的方法分类;
S3:根据日期、时间、经纬度计算太阳高度角;
S4:根据当前逆变器功率、环境温度、太阳高度角拟合辐照度,不同的决策树类别运用不同的神经网络参数去拟合;
S5:运用决策树预测缺失点所属的类别,运用对应的神经网络预测缺失的辐照度值,进行序列插补;
S6:输出完整的辐照度序列。
进一步的,所述步骤S1包括如下过程:
输入一个辐照度序列,检测序列中缺失的辐照度值,列出缺失索引,进行标记;将辐照度完整的部分定为训练数据集,将缺失辐照度的部分定为测试数据集。
进一步的,所述步骤S2包括如下过程:
对于训练数据集D={(x1,y1),(x2,y2),...,(xN,yN)},其中,N为样本容量,为输入实例,yi∈{1,2,...,K}为类别标签,K为类别数量,特征向量为两维向量,分别是天气现象的种类和温度,定义正则化的极大似然函数为损失函数,生成决策树,再自下而上进行剪枝,完成对训练数据集的分类。
进一步的,所述步骤S3包括如下过程:
基于以下公式计算太阳高度角
其中,为纬度,ω=15HS-180为时角,赤纬角n为一年中的日期序号,HS为北京时间。
进一步的,所述步骤S4包括如下过程:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于东南大学,未经东南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011065113.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种虚拟诊疗系统和方法
- 下一篇:一类精油组合物及其在制备通督精油中的用途