[发明专利]基于深度强化学习的异构柔性负荷实时调控方法和装置有效

专利信息
申请号: 202011389959.0 申请日: 2020-12-02
公开(公告)号: CN112488531B 公开(公告)日: 2022-09-06
发明(设计)人: 肖云鹏;蔡秋娜;关玉衡;张兰;白杨;刘思捷 申请(专利权)人: 广东电网有限责任公司电力调度控制中心
主分类号: G06Q10/06 分类号: G06Q10/06;G06Q50/06;G06N3/08;G06K9/62;G06F30/27;H02J3/00;H02J3/14
代理公司: 北京集佳知识产权代理有限公司 11227 代理人: 苏云辉
地址: 510600 广*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 基于 深度 强化 学习 柔性 负荷 实时 调控 方法 装置
【权利要求书】:

1.一种基于深度强化学习的异构柔性负荷实时调控方法,其特征在于,包括:

对电力系统不同类型的异构柔性负荷分别建立单一柔性负荷动态模型,得到单一柔性负荷的状态变量、动作变量、环境变量和回报函数;

根据所有单一柔性负荷的所述状态变量、动作状态变量、环境变量和回报函数,建立异构柔性负荷聚合模型,所述异构柔性负荷聚合模型包括聚合负荷的状态变量、状态空间、动作变量、动作空间和状态转移函数;其中,所述异构柔性负荷聚合模型为:

s(t+1)=Ftransition(s(t),a(t),w(t))

其中,s(t+1)为t+1时刻聚合负荷的状态变量,Ftransition(s(t),a(t),w(t))为t时刻聚合负荷的状态转移函数,s(t)为t时刻聚合负荷的状态变量,a(t)为t时刻聚合负荷的动作变量,w(t)为t时刻的环境变量,Ragg(t)为聚合负荷在t时刻的回报函数,rDR(t)为t时刻聚合负荷参与需求响应的总收益,λ(t)(Pagg(t)-Pbase(t))Δt为电费支出减少量,fiunc为用户不适应度,TiL为用户的舒适度温度下限;TiU为用户的舒适温度上限,Timin为设备i的温度变化下限,Timax为设备i的温度变化上限,N为电采暖设备数,L为电热水设备数,Ti(t)为室内温度,为室内温度Ti(t)超出用户的舒适温度上限TiU的不适度惩罚因子,为室内温度Ti(t)低于用户的舒适温度下限TiL的不适度惩罚因子;

将所述聚合模型应用到电力系统实时调控环境下,得到聚合负荷参与实时响应的回报函数;

建立聚合负荷实时调控深度强化学习模型,根据所述聚合负荷的状态变量、动作变量、状态转移函数和参与实时响应的回报函数,对所述聚合负荷实时调控深度强化学习模型进行训练,得到柔性负荷聚合的实时优化调控决策模型;

将目标聚合负荷的状态变量输入柔性负荷聚合的实时优化调控决策模型,得到聚合负荷实时调控的最优策略。

2.根据权利要求1所述的基于深度强化学习的异构柔性负荷实时调控方法,其特征在于,所述单一柔性负荷动态模型包括负荷温控动态函数、用户不适度函数和回报函数。

3.根据权利要求1所述的基于深度强化学习的异构柔性负荷实时调控方法,其特征在于,所述聚合负荷实时调控深度强化学习模型采用深度Q值网络算法训练。

4.根据权利要求3所述的基于深度强化学习的异构柔性负荷实时调控方法,其特征在于,所述深度强化学习模型的损失函数为:

其中,yj为Q网络函数的目标值,m为样本数,θ为Q网络函数的权重系数,sj为第j个样本的状态变量,aj为第j个样本的动作变量。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司电力调度控制中心,未经广东电网有限责任公司电力调度控制中心许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202011389959.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top