[发明专利]基于分布式深度强化学习的微网隐私保护与能量调度方法在审
| 申请号: | 202310061103.8 | 申请日: | 2023-01-16 |
| 公开(公告)号: | CN115983598A | 公开(公告)日: | 2023-04-18 |
| 发明(设计)人: | 王雷;郭方洪;何通;王文海 | 申请(专利权)人: | 浙江大学 |
| 主分类号: | G06Q10/0631 | 分类号: | G06Q10/0631;G06F21/62;G06N20/00;G06Q50/06 |
| 代理公司: | 杭州求是专利事务所有限公司 33200 | 代理人: | 林超 |
| 地址: | 310058 浙江*** | 国省代码: | 浙江;33 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 分布式 深度 强化 学习 隐私 保护 能量 调度 方法 | ||
1.一种基于分布式深度强化学习的微网隐私保护与能量调度方法,其特征在于,包括如下步骤:
步骤1)根据微电网系统构建微电网多智能体强化学习模型,同时根据主电网建立对应的智能体进行本地调度管理;
步骤2)建立微电网隐私保护与能量调度模型;
步骤3)微电网多智能体强化学习模型输出当前时刻的动作集合,当前时刻的动作集合包括各可控发电单元输出的当前时刻发电机功率变化值以及为发电功率数据加噪所需的隐私保护预算参数;根据微电网多智能体强化学习模型的当前时刻状态值集合计算出对应敏感度,各个敏感度再结合对应隐私保护预算参数通过差分隐私算法生成对应拉普拉斯噪声,将拉普拉斯噪声加到对应发电功率数据中后获得观测数据集;将观测数据集传输给主电网,主电网通过观测数据集获取节点差额电量,主电网智能体根据节点差额电量输出对应的动作,动作为主电网与微电网节点的交互电量,根据主电网与微电网节点的交互电量、发电机功率变化值更新出微电网多智能体强化学习模型的下一时刻状态值集合;
步骤4)根据微电网多智能体强化学习模型的动作集合以及当前时刻和下一时刻的状态值集合,利用微电网隐私保护与能量调度模型计算微电网多智能体强化学习模型的总奖励值,若此时对应的回合数达到预设数据采集回合,则开始从经验池中提取历史数据以更新强化学习模型;若未达到则不从经验池中提取历史数据更新强化学习模型,直接进行下一时刻;
步骤5)重复步骤3)-4),直到当前回合结束,若回合结束则重置时刻、发电机发电功率、储能单元荷电状态、主电网交互功率数据,接着采集下一回合的负载需求、实时电价数据;
步骤6)继续重复步骤5),在回合迭代中不断收集、读取历史数据,从而更新强化学习模型,最终不断输出调度策略,实现微电网能量调度及隐私保护最优化。
2.根据权利要求1所述的一种基于分布式深度强化学习的微网隐私保护与能量调度方法,其特征在于,所述微电网多智能体强化学习模型包括n个智能体,分别根据n个独立发电单元构建获得,n个智能体的经验池共享,微电网多智能体强化学习模型通过以下公式进行设置:
A(t)=[a(1,t),a(2,t),...,a(n,t)]T
S(t)=[s(1,t),s(2,t),…,s(n,t)]T
Ctr(t)=[c(1,t),c(2,t),...,c(n,t)]T
R(t)=[r(1,t),r(2,t),...,r(n,t)]T
a(i,t)=[ΔPk(i,t),ε]T
其中,A(t)表示时刻t各智能体输出的动作集合,S(t)表示时刻t各智能体的状态值集合,Ctr(t)表示时刻t各智能体的动作策略集合,表示从状态到具体动作的映射关系,R(t)表示时刻t各智能体的奖励值集合,即总奖励值,a(i,t)表示时刻t第i个智能体输出的动作,s(i,t)表示时刻t第i个智能体的本地状态值,c(i,t)表示时刻t第i个智能体的动作策略,r(i,t)表示时刻t第i个智能体的本地奖励值,Pk(i,t)表示时刻t第i个独立发电单元的发电功率,d(j,t)表示时刻t第j个负载的负载需求,SoC(t)表示时刻t储能单元的荷电状态,Pess(t)表示时刻t储能单元的充放电功率,T表示转置,ε为隐私保护预算,ΔPk(i,t)为时刻t第i个独立发电单元功率变化量,n表示独立发电单元数量,m表示负载数量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浙江大学,未经浙江大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310061103.8/1.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





