[发明专利]基于群智能强化学习的电网最优碳能复合流获取方法有效
申请号: | 201510369060.5 | 申请日: | 2015-06-26 |
公开(公告)号: | CN105023056B | 公开(公告)日: | 2018-10-30 |
发明(设计)人: | 张孝顺;郭乐欣;余涛;王思橦;谭敏 | 申请(专利权)人: | 华南理工大学 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06 |
代理公司: | 广州市华学知识产权代理有限公司 44245 | 代理人: | 罗观祥 |
地址: | 510640 广*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于群智能强化学习的电网最优碳能复合流获取方法,步骤为:S1、建立多目标最优碳能复合流模型目标函数;S2、根据目标函数设置奖励函数;S3、根据资格迹来更新每个主体的Qi值矩阵;S4、计算每个主体的贪婪动作;S5、更新每个主体的动作概率矩阵;S6、随机选择每个主体当前状态下的预判动作;S7、协同输入多个主体,求解群体最优动作;S8、更新得到修正后的动作值;S9、确定控制变量矩阵,进行潮流计算;S10、潮流计算后,判断Q值矩阵是否收敛,若是,将最后一次潮流计算得到结果作为电网最优碳能复合流;否则回S2。本发明方法使电网中的能量流和碳排放流损耗量达到最小,在保证较好全局寻优能力的同时,明显提高算法的收敛速度。 | ||
搜索关键词: | 基于 智能 强化 学习 电网 最优 复合 获取 方法 | ||
【主权项】:
1.一种基于群智能强化学习的电网最优碳能复合流获取方法,其特征在于,步骤如下:S1、根据电网负荷节点系统构建群智能强化学习系统,然后建立群智能强化学习系统的多目标最优碳能复合流模型目标函数;S2、在群智能强化学习系统群体的主体更新迭代过程中,根据步骤S1中建立的多目标最优碳能复合流模型目标函数,设置奖励函数;S3、按照负荷消耗的能量的差别,把负荷离散化划分成不同的断面,根据断面负荷消耗的能量值确定每个主体i的状态si,然后根据多步回溯Q(λ)学习的资格迹来更新每个主体i的Qi值矩阵;S4、计算每个主体i的贪婪动作aig;S5、根据步骤S3每个主体i更新后的Qi值矩阵,再更新每个主体i的动作概率矩阵Pi;S6、根据步骤S5每个主体i更新后的动作概率矩阵Pi,随机选择每个主体i当前状态sik下的预判动作aikp,其中k为群体的当前迭代次数;S7、根据负荷值确定的状态s,并协同输入多个主体,将贪婪动作aig视为各主体i最优动作,然后求解群体最优动作aib;S8、根据步骤S6得到的每个主体i当前状态sik下的预判动作aikp以及步骤S7求解得到的群体最优动作aib,更新得到修正后的动作值aik:![]()
其中
为每个主体i的动作修正偏差,c1、c2为学习因子,r1和r2是权重系数;S9、确定群智能强化学习系统的控制变量矩阵,然后结合步骤S8更新得到群体中各主体i修正后的动作值aik进行潮流计算;进入步骤S10;S10、潮流计算后,判断每个主体i的Qi值矩阵是否收敛,即Qi值矩阵是否在本次潮流计算过程中保持不变;若是,则将群体最后一次潮流计算得到的结果作为电网最优碳能复合流;若否,则回到步骤S2,并且将群体的当前迭代次数加1。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华南理工大学,未经华南理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201510369060.5/,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06 计算;推算;计数
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理