[发明专利]一种基于自适应动态规划的输入受限微分对策制导方法有效
申请号: | 201710089678.5 | 申请日: | 2017-02-20 |
公开(公告)号: | CN106647287B | 公开(公告)日: | 2019-02-12 |
发明(设计)人: | 孙景亮;刘春生;单一;魏阿龙 | 申请(专利权)人: | 南京航空航天大学 |
主分类号: | G05B13/04 | 分类号: | G05B13/04 |
代理公司: | 南京经纬专利商标代理有限公司 32200 | 代理人: | 朱桢荣 |
地址: | 210016 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于自适应动态规划的输入受限微分对策制导方法,旨在解决非线性微分对策问题中的HJI方程求解问题以及输入饱和问题。该方法利用自适应动态规划技术实现非线性微分对策的输入受限求解问题,结合神经网络和Lyapunov方法得到制导控制量。基于评价网络更新律,输入受限微分对策制导律可以在线实时获得,使得导弹‑目标相对运动关系中的视线角速率趋近于零,从而保证拦截成功。 | ||
搜索关键词: | 一种 基于 自适应 动态 规划 输入 受限 微分 对策 制导 方法 | ||
【主权项】:
1.一种基于自适应动态规划的输入受限微分对策制导方法,其特征在于,包括以下步骤:步骤1、设导弹与目标的运动为质点运动,且其速度大小恒定,定义M和T分别表示导弹和目标,VM表示导弹的速度,VT表示目标的速度;α表示导弹的航向角,β表示目标的航向角,
表示α对时间的一阶导数,
表示β对时间的一阶导数;θ为视线角;视线角速率
表示为σ;导弹与目标之间的相对距离为r,
表示r对时间的一阶导数;Vr表示导弹与目标之间的视线角相对速度;uM表示导弹垂直于速度向量的加速度控制量,vT表示目标垂直于速度向量的加速度控制量;建立二维平面导弹‑目标的相对运动方程:
考虑导弹与目标均表现为一阶自动驾驶仪,定义(xM,yM)为拦截弹在二维平面的坐标位置,且
表示xM对时间的一阶导数,
表示yM对时间的一阶导数;aM表示导弹侧向加速度,
表示aM对时间的一阶导数;τM为拦截弹自动驾驶仪时间常数;拦截弹自动驾驶仪如公式(2)所示:
定义(xT,yT)是目标在二维平面的坐标位置,且
为xT对时间的一阶导数,
为yT对时间的一阶导数;aT表示目标侧向加速度,
表示aT对时间的一阶导数;τT为目标自动驾驶仪时间常数;目标自动驾驶仪如公式(3)所示:
步骤2、基于平行接近法,在制导末时刻,通过保证导弹与目标之间的视线角速率等于零,即σ=0,从而保证导弹与目标之间的距离最小,实现成功拦截;对式(1)进行简化,并定义
为σ对时间的一阶导数;获得关于视线角速率σ的微分方程
步骤3、设计新的独立变量
其中,r(0)表示导弹与目标之间的初始距离;r(t)表示在t时刻导弹与目标之间的距离;符号ln(·)表示对数运算;定义剩余时间tgo=‑r(t)/Vr;基于独立变量
定义状态变量x1和x2,x1=θ,x2=σtgo,并将x1和x2表示为向量形式,即状态变量x=[x1,x2]T=[θ,σtgo]T,上标T表示转置;基于独立变量t,对式(4)进行变换,得到新模型如下:
式(5)中,导弹和目标新的控制量u和v分别表示为
对公式(5)和(6)整理得到微分对策模型为:x′=f(x)+g(x)u+k(x)v (7)式(7)中,x′表示状态变量x对独立变量
求导,即,![]()
导弹新的控制量u考虑输入受限问题,表述为|u|≤λ,λ表示控制输入饱和界限;步骤4、根据二人零和微分对策方法,分别定义导弹和目标的反馈控制量为u(x)和v(x),得到输入受限微分对策制导律如下:
其中,
上标*表示变量的最优值,R2>0为预先设计的正定对称矩阵,上标‑1表示求逆运算,R1为预先设定的正定对称矩阵,Vx表示性能指标函数V(x)对状态x求偏导数,即,![]()
表示最优性能指标函数V*(x)对状态x求偏导数,即,
tanh(·)表示双曲正切函数;Q(x)≥0表示与状态相关的半正定函数,
满足如下HJI方程:
步骤5、执行微分对策制导律;具体如下:根据神经网络逼近方法,设计评价网络近似最优代价函数,V*(x)的近似形式表示为![]()
式(9)中,
为评价网络近似权值向量,σc(x)是评价网络激活函数向量;利用式(9),得到近似的输入受限微分对策制导律,定义导弹的近似反馈控制量为
目标的近似反馈控制量为
表示为
其中,
▽xσc(x)表示激活函数σc(x)对状态x的偏导数,即,
设计
更新律如下:
式(11)中,
表示
对时间的一阶导数,ec为评价网络的输出误差,
Jx表示连续可微的径向无界Lyapunov函数J(x)对状态变量x求偏导数;
sgn(·)表示符号函数;α1>0表示权值学习率;Y1和Y2表示设计参数;
定义为如下表达式:![]()
表示函数J(x)对时间t求导;通过设计
更新律,输入受限微分对策制导律能够在线执行,完成对机动目标的拦截。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京航空航天大学,未经南京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201710089678.5/,转载请声明来源钻瓜专利网。