[发明专利]一种自适应不确定性的电力系统动态经济调度方法在审
申请号: | 202210560992.8 | 申请日: | 2022-05-23 |
公开(公告)号: | CN114897388A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 汪旸;王春明;廖思阳;朱可凡;魏聪颖;徐箭;刘亦朋 | 申请(专利权)人: | 国家电网公司华中分部;武汉大学 |
主分类号: | G06Q10/06 | 分类号: | G06Q10/06;G06Q50/06;H02J3/00;H02J3/46 |
代理公司: | 武汉科皓知识产权代理事务所(特殊普通合伙) 42222 | 代理人: | 许莲英 |
地址: | 430070 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 自适应 不确定性 电力系统 动态 经济 调度 方法 | ||
1.一种自适应不确定性的电力系统动态经济调度方法,其特征在于,包括以下步骤:
步骤1,导入电力系统中每个调度时段的状态变量,所述电力系统每个调度时段的状态变量包括每个调度时段的发电机组状态变量、每个调度时段的新能源状态变量、每个调度时段的负荷状态变量;得到的数据包含了所有调度时间段的状态,调度日数为D,以每个调度日作为一个调度周期,每个调度周期包含了T个调度时段;以下表述某个调度时段t的状态空间表述方法:
首先需要观测发电机组的出力值、向上备用容量、向下备用容量,N台发电机组的状态空间可用下式归纳:
sG,t=(P1,t,P2,t…PN,t,U1,t,U2,t…UN,t,D1,t,D2,t…DN,t)
式中,下标中t表示第t个调度时刻,sG,t表示发电机组状态空间,下标数字1,2,…N代表发电机编号,P代表功率,U代表发电机向上备用容量,D代表发电机向下备用容量;
其次对于具有随机性的光伏出力、风电出力、负荷,不仅考虑了其实时值的大小,还考虑了其时序相关性而引入其一次导数和二次导数:
sM,t=(PPV,t,PWT,t,PL,t,PPV,d1,t,PWT,d1,t,PL,d1,t,PPV,d2,t,PWT,d2,t,PL,d2,t)
式中,下标中t表示第t个调度时刻,sM,t表示第t个调度时段的随机状态空间,PPV,t为第t个调度时段光伏出力,PWT,t为第t个调度时段风机出力,PL,t为第t个调度时段负荷需求;下标中d1表示一次导数,d2表示二次导数,第t个调度时段的一次导数和二次导数求解方法如下:
PPV,d1,t=PPV,t-PPV,t-1
PPV,d2,t=PPV,t-2PPV,t-1+PPV,t-2
PWT,d1,t=PWT,t-PWT,t-1
PWT,d2,t=PWT,t-2PWT,t-1+PWT,t-2
PL,d1,t=PL,t-PL,t-1
PL,d2,t=PL,t-2PL,t-1+PL,t-2
式中PPV,t为第t个调度时段光伏出力,PWT,t为第t个调度时段风机出力,PL,t为第t个调度时段负荷需求;PPV,t-1为第t-1个调度时段光伏出力,PWT,t-1为第t-1个调度时段风机出力,PL,t-1为第t-1个调度时段负荷需求;PPV,d1,t为第t个调度时段光伏出力的一次导数,PWT,d1,t为第t个调度时段风机出力的一次导数,PL,d1,t为第t个调度时段负荷需求的一次导数,PPV,d2,t为第t个调度时段光伏出力的二次导数,PWT,d2,t为第t个调度时段风机出力的二次导数,PL,d2,t为第t个调度时段负荷需求的二次导数
则获取的维数为(3N+9)的状态空间最终可以表示为:
st={sG,t,sM,t}
式中,st为第t个调度时刻状态空间,sG,t为第t个调度时刻发电机组状态空间,sM,t表示第t个调度时段的随机状态空间;
步骤2,初始化策略网络和Q值网络,包括了:原策略网络参数θQ,目标策略网络参数θQ',原Q值网络参数θμ,目标Q值网络参数θμ',设定学习迭代次数K,确定调度周期长度T,初始化经验池,设定动作-学习比例Z;初始迭代次数k=0,调度时段t=0;确定折扣因子γ∈[0,1];
步骤3,初始化电力系统状态.随机选择一个调度日的第一个调度时段t=0初始化状态空间s0;迭代次数k=k+1;
步骤4,根据策略网络输出决策动作值,并以探索性动作机制执行实际动作值,调度时段t=t+1;实际动作值可用下式表示:
其中,是策略网络采取的实际动作,由常规发电机组功率调整值以及向上备用调整值向下备用调整值组成,at是输出的决策动作,n为随机噪声,p为随着迭代次数逐渐衰减的噪声占比;
步骤5,根据策略网络采取的实际动作计算即时奖励rt;即时奖励rt可由下式给出:
rt=-0.05(FG,t+FR,t+FS,t)
式中FG,t为发电机组在第t个调度时段的常规发电机成本,FR,t为发电机组在第t个调度时段的备用成本,FS,t为发电机组在第t个调度时段的随机性成本;具体为:
其中,下标中t表示第t个调度时段,对于第t个调度时段:hi为第i个机组对应的常数项成本系数,bi为第i个机组对应的一次项成本系数,ci为第i个机组对应的二次项成本系数,模型内考虑有N个常规机组;
备用成本为系统预旋转备用产生的成本:
式中,下标中t表示第t个调度时段,对于第t个调度时段:FR,t为备用成本,Ui,t为第i个发电机的向上备用容量,Di,t为第i个发电机的向上备用容量,kU为向上备用成本系数,kD为向下备用成本系数;
随机性成本充分考虑了电力系统的不确定性,是由光伏以及风电出力的预测误差造成的,预测误差造成的功率差额可由旋转备用弥补,但超出备用裕量时会导致切负荷或是弃风、弃光现象:
FS,t=(cUPU,t+cDPD,t)+(cLPL,t+cAPA,t)t
式中,下标中t表示第t个调度时段,对于第t个调度时段:FS,t为随机性成本,PU,t是向上备用功率,PD,t是向下备用功率,PL,t是被切除负荷,PA,t是弃风弃光总功率分,cU是向上备用成本系数,cD是向下备用成本系数,cL是被切除负荷成本系数,cU是弃风弃光成本系数;
步骤6,根据第t个调度时段策略网络采取的实际动作值和状态空间st={sG,t,sM,t},确定下一个调度时段状态空间st+1;下一个调度时段状态空间st+1的发电机状态可由下式表示:
st+1={sG,t+1,sM,t+1}
其中,sM,t+1为第t+1调度时段的随机状态空间,sG,t+1为第t+1调度时段发电机状态;第t+1调度时段发电机状态sG,t+1由第t个调度时段状态st和第t个调度时段采取的实际动作值决定:
步骤7,由步骤3-5得到状态转移过程;状态转移过程可由下式表述:
{st,at,rt,st+1}
式中,st为第t个调度时段的状态空间,at为第t个调度时段策略网络的输出动作值,rt为第t个调度时段的即时奖励,st+1是第t+1个调度时段的状态空间;
记录到经验池中,完成一次经验回收;利用动作-学习比例机制,每回收Z次进行一次学习,Z为设定好的动作-学习比例,作为优选,当Z=4时,每产生4次动作,即产生了4次经验,而学习一次;学习是指更新神经网络参数,具体为如下步骤:
步骤7.1,更新原Q值网络:
其中,θQ为原Q值网络的网络参数,αQ为原Q值网络的学习率,为梯度计算函数,L(θQ)为损失函数;损失函数L(θQ)具体为:
L(θQ)=E(yt-Q(st,at|θQ)2)
式中E(·)为数学期望函数,st为第t个调度时段状态空间,at|θQ为在原Q值网络参数为θQ条件下第t个调度时段原Q值网络的输出动作值,yt为目标Q值,Q(st,at)为动作-值函数;目标Q值yt可由下式计算:
yt=rt+γQ(st+1,μ′(st+1|θμ′)|θQ′);
式中rt为第t个调度时段的即时奖励,γ为折扣因子,θμ′为目标策略网络参数,θQ′为目标Q值网络参数;μ′(st)表示在第t个调度时段条件下,目标网络输出的动作值,定义为:
前述式中,动作-值函数Q(st,at)可由下式定义:
式中,t表示第t个调度时段,st为第t个调度时段状态空间,at为第t个调度时段策略网络的输出动作值,E(·)为数学期望函数,T为调度周期长度,γ为折扣因子,rt+m(st+m,at+m)为第t+m个调度时段的即时奖励;
步骤7.2,更新原策略网络:
式中,θμ为原策略网络的网络参数,αμ为原策略网络的学习率,为梯度计算函数,μ为原策略网络输出的动作;计算方法为:
其中,下标t表示第t个调度时段,为梯度计算函数,s为状态空间,θQ为原Q值网络参数,θμ为原策略网络参数,a|θQ为在原Q值网络参数为θQ条件下的原Q值网络参数输出动作值;μ(s)表示原网络输出的动作值,定义为:前述式中,动作-值函数Q(st,at)可由下式定义:
步骤7.3,更新目标网络:
其中,θμ′为目标策略网络参数,θQ′为目标Q值网络参数,θQ为原Q值网络参数,θμ为原策略网络参数,τ为软更新模式下的网络更新速度,一般远远小于1;软更新模式导致目标网络更新很慢,好处是学习的稳定性增强,更易于收敛;
步骤8,若调度时段t小于调度周期T,则返回第4步;
步骤9,若动作次数k小于设定学习迭代次数K,则返回步骤3;否则,训练结束,输出训练后的模型。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于国家电网公司华中分部;武汉大学,未经国家电网公司华中分部;武汉大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210560992.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理