[发明专利]一种基于深强化学习的航空发动机控制方法、装置在审
| 申请号: | 202010328588.9 | 申请日: | 2020-04-23 |
| 公开(公告)号: | CN111486009A | 公开(公告)日: | 2020-08-04 |
| 发明(设计)人: | 郑前钢;项德威;席志华;陈浩颖;刘子赫;张海波;胡忠志;李秋红 | 申请(专利权)人: | 南京航空航天大学 |
| 主分类号: | F02C9/28 | 分类号: | F02C9/28 |
| 代理公司: | 北京德崇智捷知识产权代理有限公司 11467 | 代理人: | 杨楠 |
| 地址: | 210000 江*** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 一种 基于 强化 学习 航空发动机 控制 方法 装置 | ||
1.一种基于深强化学习的航空发动机控制方法,首先根据控制指令和反馈参数获得初始的燃油流量,然后根据预设的发动机物理限制对初步的燃油流量进行修正,最后按照修正后的燃油流量向航空发动机输入相应流量的燃油;其特征在于,所述根据控制指令和反馈参数获得初始的燃油流量,具体是通过深度强化学习网络实现,所述深度强化学习网络的动作值函数Qj(s,a)如下:
其中s是发动机状态,a是发动机的动作,α是深度强化学习的学习率,r是回报值,γ是回报衰减率,sj是第j时刻发动机状态,st是发动机目标状态;回报值rj的计算公式具体如下:
其中,是预测的控制目标值,u是发动机控制输入,Q和R是正定的对称矩阵。
2.如权利要求1所述基于深强化学习的航空发动机控制方法,其特征在于,所述深度强化学习网络的输入为当前和过去的燃油流量Wfb、过去时刻风扇转子转速Nf、压气机转子转速Nc、风扇喘振裕度Smf、压气机喘振裕度Smc以及高压涡轮进口温度T41,所述深度强化学习网络的输出为动作值函数。
3.一种基于深强化学习的航空发动机控制装置,包括:用于根据控制指令和反馈参数获得初始的燃油流量的控制器,用于根据预设的发动机物理限制对初步的燃油流量进行修正的限制选择单元;用于按照修正后的燃油流量向航空发动机输入相应流量的燃油的执行机构;其特征在于,所述控制器为深度强化学习网络,所述深度强化学习网络的动作值函数Qj(s,a)如下:
其中s是发动机状态,a是发动机的动作,α是深度强化学习的学习率,r是回报值,γ是回报衰减率,sj是第j时刻发动机状态,st是发动机目标状态;回报值rj的计算公式具体如下:
其中,是预测的控制目标值,u是发动机控制输入,Q和R是正定的对称矩阵。
4.如权利要求3所述基于深强化学习的航空发动机控制装置,其特征在于,所述深度强化学习网络的输入为当前和过去的燃油流量Wfb、过去时刻风扇转子转速Nf、压气机转子转速Nc、风扇喘振裕度Smf、压气机喘振裕度Smc以及高压涡轮进口温度T41,所述深度强化学习网络的输出为动作值函数。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202010328588.9/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种轻质隔热砖及其制备方法
- 下一篇:一种萘醌生产含铬废液制备氧化铬绿的方法





