[发明专利]一种基于强化学习的失效航天器姿态调整方法在审

申请号：	202211664720.9	申请日：	2022-12-23
公开（公告）号：	CN115973454A	公开（公告）日：	2023-04-18
发明（设计）人：	黄静;孟亦真;田路路;孙俊;朱东方	申请（专利权）人：	上海航天控制技术研究所
主分类号：	B64G1/24	分类号：	B64G1/24
代理公司：	上海元好知识产权代理有限公司 31323	代理人：	张双红;张静洁
地址：	201109 ***	国省代码：	上海;31
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于强化学习失效航天器姿态调整方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于强化学习的失效航天器姿态快速调整方法，其特征在于，包括如下步骤：

步骤S1、基于航天器姿态末端约束，建立失效航天器姿态数学模型与约束模型；

步骤S2、基于强化学习算法中的Long-term性能指标函数，建立评判标准和Critic网络；

步骤S3、基于Backstepping控制框架结合Action网络和所述Critic网络，建立自适应控制方法，以控制失效航天器进入末端约束域。

2.如权利要求1所述的基于强化学习的失效航天器姿态快速调整方法，其特征在于，所述步骤S1包括：

所述失效航天器姿态数学模型为失效航天器姿态动力学与运动学模型，其计算公式如下：

其中，q＝col(q_v,q₄)为基于四元数的航天器状态描述，q_v＝[q₁,q₂,q₃]^T，下标v表示四元数矢量部分，q₁～q₄分别表示航天器姿态四元数的四个分量；ω＝[ω_x,ω_y,ω_z]^T表示航天器本体系B相对惯性系I的三轴旋转角速度，ω_x,ω_y,ω_z分别为航天器x,y,z轴的角速度，J表示航天器正定对称的转动惯量矩阵；τ,T_d分别为控制力矩、航天器受到的外部扰动及系统建模误差；I_n表示n维的单位矩阵，n＝3。

3.如权利要求2所述的基于强化学习的失效航天器姿态快速调整方法，其特征在于，所述失效航天器的约束模型包括：

所述失效航天器末端约束根据所述失效航天器的推力器的安装布局和推力矢量，选择如下：

-q_m≤q₂≤q_m

-ω_m≤ω_y≤ω_m

其中，q_m,ω_m,g_min,g_max分别为第二个姿态四元数参数上限、俯仰角速度上限、第三个姿态四元数与偏航角速度之比的上限。

通过椭球约束域使得上述约束因素同时满足，所述椭球约束域s²如下：

4.如权利要求3所述的基于强化学习的失效航天器姿态快速调整方法，其特征在于，所述步骤S2包括：

基于Long-term性能指标函数如下：

其中，T＞0为小的强化学习积分步长；γ∈(0,1)为折扣因子；如果控制系统状态进入吸引域中，则控制目标实现，Long-term性能指标函数J(t)不会增加；如果控制系统状态背离吸引域，则控制器应调节控制输出，使得控制系统状态朝着末端约束域、或者保持在约束域中；

因此，期望的性能指标J_d(t)＝0，定义p(s)为包含Long-term性能指标；p(s(ξ))如下：

其中，s²(t)表示t时刻的椭球约束域，s(ξ)表示ξ时刻的椭球约束域的平方根，ξ为积分的时间变量，c_p＞0为需要设计的松弛因子；即：p(s(ξ))＝0表征好的控制输出，而p(s(ξ))＝1表明当前的控制输出较差；1意味着性能指标函数J(t)的持续增加，使得控制结果变差，航天器姿态背离末端约束域；而0意味着性能指标函数J(t)的持续减少，使得控制结果变好，航天器姿态进入末端约束域。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于上海航天控制技术研究所，未经上海航天控制技术研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202211664720.9/1.html，转载请声明来源钻瓜专利网。

上一篇：自动驾驶车辆的决策方法、装置和电子设备
下一篇：一种基于大数据零售商贸用可自动补货的商贸货物售卖机

同类专利

专利分类

B 作业；运输

B64 飞行器；航空；宇宙航行
B64G 宇宙航行；及其所用的飞行器或设备
B64G1-00 宇宙航行的飞行器
B64G1-10 . 人造卫星；人造卫星的系统，星际的飞行器
B64G1-14 . 航天飞机
B64G1-16 . 地外车
B64G1-22 . 宇宙航行飞行器的部件或专门适用于装入或装到宇宙航行运载工具上的设备
B64G1-24 ..制导或控制装置，例如用于姿态控制的

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于强化学习的失效航天器姿态调整方法在审

专利文献下载