[发明专利]一种飞机自动控制系统、方法、电子设备及可读存储介质有效
申请号: | 202210567090.7 | 申请日: | 2022-05-24 |
公开(公告)号: | CN114660977B | 公开(公告)日: | 2022-08-23 |
发明(设计)人: | 杨晟琦;于津;詹光 | 申请(专利权)人: | 中国航空工业集团公司沈阳飞机设计研究所 |
主分类号: | G05B19/042 | 分类号: | G05B19/042 |
代理公司: | 北京航信高科知识产权代理事务所(普通合伙) 11526 | 代理人: | 郭鹏鹏 |
地址: | 110035 辽*** | 国省代码: | 辽宁;21 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 飞机 自动控制系统 方法 电子设备 可读 存储 介质 | ||
1.一种飞机自动控制系统,其特征在于,包括:
兴奋抑制平衡网络模块,以当前时刻飞机飞行状态为输入,输出飞机控制模式,其中,飞机控制模式包括:
兴奋模式;
抑制模式,维持对飞机进行控制的机动动作不变;
机动决策网络模块,在飞机控制模式为兴奋模式时,以当前时刻飞机飞行状态为输入,输出对飞机进行控制的机动动作;
价值网络训练模块,用以对兴奋抑制平衡网络模块、机动决策网络模块进行训练,包括:
兴奋抑制平衡网络模块以当前时刻飞机飞行状态为输入,输出飞机控制模式;
在飞机控制模式为抑制模式时,维持对飞机进行控制的机动动作不变,得到下一时刻飞机飞行状态;
在飞机控制模式为兴奋模式时,机动决策网络模块以飞机飞行状态为输入,输出对飞机进行控制的机动动作,得到下一时刻飞机飞行状态;
计算飞机当前时刻飞机飞行状态的价值、下一时刻飞机飞行状态的价值;
基于飞机当前时刻飞机飞行状态的价值、下一时刻飞机飞行状态的价值,更新兴奋抑制平衡网络模块、机动决策网络模块、价值网络训练模块的参数,直至达到最大迭代次数;
所述价值网络训练模块中,对兴奋抑制平衡网络模块、机动决策网络模块进行训练,兴奋抑制平衡网络模块以当前时刻飞机飞行状态为输入,输出飞机控制模式,具体为:
兴奋抑制平衡网络模块以当前时刻飞机飞行状态为输入,得到飞机控制模式为兴奋模式概率,对参数为该概率的伯努利分布进行采样,若采样结果为1,则输出飞机控制模式为兴奋模式,若采样结果为0,则输出飞机控制模式为抑制模式;
所述价值网络训练模块中,对兴奋抑制平衡网络模块、机动决策网络模块进行训练,基于当前时刻飞机飞行状态的价值、下一时刻飞机飞行状态的价值,更新兴奋抑制平衡网络模块、机动决策网络模块、价值网络训练模块的参数,具体为:
A=A0-lrA( R+V2-V1)*P;
B=B0+lrB(R+V2-V1)*log(Pi);
C=C0-lrC (R+V2-V1) (R+V2-V1);
其中,
A为兴奋抑制平衡网络模块更新的参数;
A0为兴奋抑制平衡网络模块当前时刻的参数;
lrA为兴奋抑制平衡网络模块的学习率;
R为下一时刻飞机飞行状态对应对飞机进行控制机动动作的即时奖励;
V2为下一时刻飞机飞行状态的价值;
V1为当前时刻飞机飞行状态的价值;
P为兴奋抑制平衡网络模块以当前时刻飞机飞行状态为输入,得到飞机控制模式为兴奋模式的概率;
B为机动决策网络模块更新的参数;
B0为机动决策网络模块当前时刻的参数;
lrB为机动决策网络模块学习率;
Pi 为在飞机控制模式为兴奋模式时,机动决策网络模块以飞机飞行状态为输入,输出对飞机进行控制机动动作的概率;
C为价值网络训练模块更新的参数;
C0为价值网络训练模块当前时刻的参数;
lrC为价值网络训练模块的学习率。
2.根据权利要求1所述的飞机自动控制系统,其特征在于,
所述兴奋抑制平衡网络模块中,以当前时刻飞机飞行状态为输入,输出飞机控制模式,具体为:
以当前时刻飞机飞行状态为输入,得到飞机控制模式为兴奋模式的概率,对参数为该概率的伯努利分布进行采样,若采样结果为1,则输出飞机控制模式为兴奋模式,若采样结果为0,则输出飞机控制模式为抑制模式;或者,
以当前时刻飞机飞行状态为输入,得到飞机控制模式为抑制模式的概率,对参数为该概率的伯努利分布进行采样,若采样结果为1,则输出飞机控制模式为抑制模式,若采样结果为0,则输出飞机控制模式为兴奋模式。
3.根据权利要求1所述的飞机自动控制系统,其特征在于,
还包括:
抑制控制模式计时模块,用以配置飞机控制模式为抑制模式的可持续时间,记录飞机控制模式为抑制模式的持续时间,在飞机控制模式为抑制模式的持续时间达到可持续时间时,兴奋抑制平衡网络模块输出飞机控制模式为兴奋模式。
4.根据权利要求3所述的飞机自动控制系统,其特征在于,
所述价值网络训练模块中,对兴奋抑制平衡网络模块、机动决策网络模块进行训练,还包括:
在抑制控制模式计时模块记录飞机控制模式为抑制模式的持续时间达到可持续时间时,兴奋抑制平衡网络模块输出飞机控制模式为兴奋模式。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国航空工业集团公司沈阳飞机设计研究所,未经中国航空工业集团公司沈阳飞机设计研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210567090.7/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种高精度压气机过渡段测量装置
- 下一篇:一种具有5G传输的工业现场采集系统