[发明专利]一种电力负荷预测中基于近邻算法进行插补补充缺失值的方法在审
申请号: | 202010601219.2 | 申请日: | 2020-06-29 |
公开(公告)号: | CN111768034A | 公开(公告)日: | 2020-10-13 |
发明(设计)人: | 顾一峰;周浩;胡炳谦;韩俊 | 申请(专利权)人: | 上海积成能源科技有限公司 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G06K9/62;G06N20/00 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 200439 上*** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 电力 负荷 预测 基于 近邻 算法 进行 补充 缺失 方法 | ||
1.本发明一种电力负荷预测中基于近邻算法进行插补补充缺失值的方法其特征在于,包括:
步骤一、
步骤二、
1)确定K值,在填充历史电力负荷数据的具体实施过程中,对于k值的选择,没有一个固定的树脂,一般根据样本的分布,选择一个较小的值,之后可以通过交叉验证选择一个合适的k值;选择较小的k值,就相当于用较小的领域中的训练实例进行预测,训练误差会减小,只有与输入实例较近或相似的训练实例才会对预测结果起作用,但是泛化误差会增大,K值的减小就意味着整体模型变得复杂,容易发生过拟合;选择较大的k值,就相当于用较大领域中的训练实例进行预测,其优点是可以减少泛化误差,但缺点是训练误差会增大;
与输入实例较远的(不相似的)训练实例也会对预测器作用,使预测发生错误,且K值的增大就意味着整体的模型变得简单;在本发明具体实施过程中,一般最小K值选为24(日小时数),最大K值为整体数据集数量的平方根;
2)确定距离计算度量;
本发明中,距离度量方式通常使用欧式距离,即:
x,y 为数据点在n维向量上的表示点;
当步骤三数据有效性验证不通过时,也可以使用曼哈顿距离:
或者闵科夫斯基距离:
计算点之间距离;
3)计算预测样本和所有训练集中的样本的距离,通过距离分类,找到与缺失值距离最近的K个距离,计算这些值的平均电力负荷数据进行缺失填充;
在具体实施过程中,可以通过计算机蛮力计算所有样本距离,或者通过其他算法如KD树,球树等进行快速运算;
4)按时间序列分步重复以上三过程,填补缺失值至原始数据集;
步骤三、
两组数据将进行单因素方差分析(one way-ANOVA),计算两组数据间显著性差异 值,需要保证两组数据间没有显著性差异;如果两组数据验证后存在显著性差异,则需要调整k的值(最近邻居的数量)或者改变距离度量方式,改善补充值的运算方式以及改变填充处理的维度以确保处理后的数据与原始数据不存在显著性差异,使处理后的数据保持准确性和有效性。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海积成能源科技有限公司,未经上海积成能源科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010601219.2/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种具有保护功能的电钻
- 下一篇:一种加热均匀的热水锅炉
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理