[发明专利]一种基于强化学习的火电燃烧优化方法有效
申请号: | 201810449729.5 | 申请日: | 2018-05-11 |
公开(公告)号: | CN108826354B | 公开(公告)日: | 2019-07-12 |
发明(设计)人: | 张卫东;邹罗葆;程引;房方;尹浩 | 申请(专利权)人: | 上海交通大学 |
主分类号: | F23N5/00 | 分类号: | F23N5/00 |
代理公司: | 上海科盛知识产权代理有限公司 31225 | 代理人: | 杨宏泰 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明涉及一种基于强化学习的火电燃烧优化方法,包括以下步骤:1)获取火力发电燃烧过程中的相关变量,定义Mt={it,st,pt}为t时刻的数据信息;2)构建预测网络,根据最近两次历史数据信息Mt‑1、Mt以及下一时刻的可控输入it+1预测下一时刻的中间状态量st+1和性能指标pt+1;3)定义St={Mt‑2,Mt‑1,it}为马尔科夫决策问题在t时刻的状态,以输入对应的增量矢量作为马尔科夫决策问题的动作At,并且以前后状态的线性加权综合指标KPI的增量ΔCIt作为马尔科夫决策问题的奖励Rt,并定义状态跳转;4)采用深度决定性策略梯度对马尔科夫决策问题进行求解。与现有技术相比,本发明具有泛化能力强、普遍适用性、快速响应等优点。 | ||
搜索关键词: | 决策问题 强化学习 燃烧优化 火电 历史数据信息 普遍适用性 综合指标 定义状态 火力发电 快速响应 燃烧过程 数据信息 线性加权 中间状态 矢量 能力强 求解 预测 构建 可控 跳转 奖励 网络 | ||
【主权项】:
1.一种基于强化学习的火电燃烧优化方法,其特征在于,包括以下步骤:1)获取火力发电燃烧过程中的相关变量,包括可控输入it、中间状态量st和性能指标pt,并定义Mt={it,st,pt}为t时刻的数据信息;2)构建预测网络,根据最近两次历史数据信息Mt‑1、Mt以及下一时刻的可控输入it+1预测下一时刻的中间状态量st+1和性能指标pt+1;3)将燃烧过程的控制输入优化问题转化为马尔科夫决策问题,定义St={Mt‑2,Mt‑1,it}为马尔科夫决策问题在t时刻的状态,以输入对应的增量矢量作为马尔科夫决策问题的动作At,并且以前后状态的线性加权综合指标KPI的增量ΔCIt作为马尔科夫决策问题的奖励Rt,并定义状态跳转;4)采用深度决定性策略梯度对马尔科夫决策问题进行求解,实现将来时刻的燃烧状态变量和性能指标的预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810449729.5/,转载请声明来源钻瓜专利网。