[发明专利]一种基于强化学习的火电燃烧优化方法有效

申请号：	201810449729.5	申请日：	2018-05-11
公开（公告）号：	CN108826354B	公开（公告）日：	2019-07-12
发明（设计）人：	张卫东;邹罗葆;程引;房方;尹浩	申请（专利权）人：	上海交通大学
主分类号：	F23N5/00	分类号：	F23N5/00
代理公司：	上海科盛知识产权代理有限公司 31225	代理人：	杨宏泰
地址：	200240 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明涉及一种基于强化学习的火电燃烧优化方法，包括以下步骤：1)获取火力发电燃烧过程中的相关变量，定义M_t＝{i_t,s_t,p_t}为t时刻的数据信息；2)构建预测网络，根据最近两次历史数据信息M_t‑1、M_t以及下一时刻的可控输入i_t+1预测下一时刻的中间状态量s_t+1和性能指标p_t+1；3)定义S_t＝{M_t‑2,M_t‑1,i_t}为马尔科夫决策问题在t时刻的状态，以输入对应的增量矢量作为马尔科夫决策问题的动作A_t，并且以前后状态的线性加权综合指标KPI的增量ΔCI_t作为马尔科夫决策问题的奖励R_t，并定义状态跳转；4)采用深度决定性策略梯度对马尔科夫决策问题进行求解。与现有技术相比，本发明具有泛化能力强、普遍适用性、快速响应等优点。
搜索关键词：	决策问题强化学习燃烧优化火电历史数据信息普遍适用性综合指标定义状态火力发电快速响应燃烧过程数据信息线性加权中间状态矢量能力强求解预测构建可控跳转奖励网络
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

1.一种基于强化学习的火电燃烧优化方法，其特征在于，包括以下步骤：1)获取火力发电燃烧过程中的相关变量，包括可控输入i_t、中间状态量s_t和性能指标p_t，并定义M_t＝{i_t,s_t,p_t}为t时刻的数据信息；2)构建预测网络，根据最近两次历史数据信息M_t‑1、M_t以及下一时刻的可控输入i_t+1预测下一时刻的中间状态量s_t+1和性能指标p_t+1；3)将燃烧过程的控制输入优化问题转化为马尔科夫决策问题，定义S_t＝{M_t‑2,M_t‑1,i_t}为马尔科夫决策问题在t时刻的状态，以输入对应的增量矢量作为马尔科夫决策问题的动作A_t，并且以前后状态的线性加权综合指标KPI的增量ΔCI_t作为马尔科夫决策问题的奖励R_t，并定义状态跳转；4)采用深度决定性策略梯度对马尔科夫决策问题进行求解，实现将来时刻的燃烧状态变量和性能指标的预测。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海交通大学，未经上海交通大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201810449729.5/，转载请声明来源钻瓜专利网。

上一篇：一种天然气锅炉助燃控制方法
下一篇：一种控制污染的煤气高空放散管自动点火装置

同类专利

专利分类

F 机械工程、照明、加热

F23 燃烧设备；燃烧方法
F23N 燃烧的调节或控制
F23N5-00 控制燃烧的系统
F23N5-02 .利用对热变化或介质的热膨胀敏感的装置
F23N5-16 .利用噪声检测器的
F23N5-18 .利用对空气或燃料流动速率敏感的探测器
F23N5-20 .带有一个通过电气装置
F23N5-22 .带有一个通过机械装置

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于强化学习的火电燃烧优化方法有效

专利文献下载