[发明专利]一种基于强化学习的火电燃烧优化方法有效

专利信息
申请号: 201810449729.5 申请日: 2018-05-11
公开(公告)号: CN108826354B 公开(公告)日: 2019-07-12
发明(设计)人: 张卫东;邹罗葆;程引;房方;尹浩 申请(专利权)人: 上海交通大学
主分类号: F23N5/00 分类号: F23N5/00
代理公司: 上海科盛知识产权代理有限公司 31225 代理人: 杨宏泰
地址: 200240 *** 国省代码: 上海;31
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明涉及一种基于强化学习的火电燃烧优化方法,包括以下步骤:1)获取火力发电燃烧过程中的相关变量,定义Mt={it,st,pt}为t时刻的数据信息;2)构建预测网络,根据最近两次历史数据信息Mt‑1、Mt以及下一时刻的可控输入it+1预测下一时刻的中间状态量st+1和性能指标pt+1;3)定义St={Mt‑2,Mt‑1,it}为马尔科夫决策问题在t时刻的状态,以输入对应的增量矢量作为马尔科夫决策问题的动作At,并且以前后状态的线性加权综合指标KPI的增量ΔCIt作为马尔科夫决策问题的奖励Rt,并定义状态跳转;4)采用深度决定性策略梯度对马尔科夫决策问题进行求解。与现有技术相比,本发明具有泛化能力强、普遍适用性、快速响应等优点。
搜索关键词: 决策问题 强化学习 燃烧优化 火电 历史数据信息 普遍适用性 综合指标 定义状态 火力发电 快速响应 燃烧过程 数据信息 线性加权 中间状态 矢量 能力强 求解 预测 构建 可控 跳转 奖励 网络
【主权项】:
1.一种基于强化学习的火电燃烧优化方法,其特征在于,包括以下步骤:1)获取火力发电燃烧过程中的相关变量,包括可控输入it、中间状态量st和性能指标pt,并定义Mt={it,st,pt}为t时刻的数据信息;2)构建预测网络,根据最近两次历史数据信息Mt‑1、Mt以及下一时刻的可控输入it+1预测下一时刻的中间状态量st+1和性能指标pt+1;3)将燃烧过程的控制输入优化问题转化为马尔科夫决策问题,定义St={Mt‑2,Mt‑1,it}为马尔科夫决策问题在t时刻的状态,以输入对应的增量矢量作为马尔科夫决策问题的动作At,并且以前后状态的线性加权综合指标KPI的增量ΔCIt作为马尔科夫决策问题的奖励Rt,并定义状态跳转;4)采用深度决定性策略梯度对马尔科夫决策问题进行求解,实现将来时刻的燃烧状态变量和性能指标的预测。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810449729.5/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top