[发明专利]一种卫星姿态的控制方法、控制装置、计算机设备和介质在审

申请号：	202210356520.0	申请日：	2022-03-30
公开（公告）号：	CN114889848A	公开（公告）日：	2022-08-12
发明（设计）人：	赵军锁;朱捷;吴凤鸽;乔鹏	申请（专利权）人：	中国科学院软件研究所
主分类号：	B64G1/24	分类号：	B64G1/24
代理公司：	北京超凡宏宇专利代理事务所(特殊普通合伙) 11463	代理人：	彭星
地址：	100190 ***	国省代码：	北京;11
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种卫星姿态控制方法装置计算机设备介质
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【说明书】：

本申请提供了一种卫星姿态的控制方法、控制装置、计算机设备和介质，控制方法包括：获取目标卫星的上一时刻运行信息和目标姿态角；将目标姿态角和上一时刻运行信息输入至实时调参的强化学习网络，计算得到目标卫星中动量轮在当前时刻的控制参数值；根据计算得到的当前时刻的控制参数值，调整目标卫星的当前时刻姿态角，以使目标卫星向着目标姿态角运行。在本申请实施例中，当目标卫星的形状、质量等参数可以随着时间的变化而变化时，本申请提供了一种可以实时调参的强化学习网络，在目标卫星的当前参数的情况下，利用强化学习网络学习出来的一种针对当前目标卫星的最优控制策略，以实现更快更准确的将目标卫星调整到目标姿态角。

技术领域

本申请涉及卫星控制领域，具体而言，涉及一种卫星姿态的控制方法、控制装置、计算机设备和介质。

背景技术

随着技术的发展，人们所需要的信息也越来越多，但是刚靠人类在地球表面搜集的信息已经不能满足人类的需求，因此人造卫星就诞生了。现阶段，人造卫星各自在对应的轨道运行，但是不同的卫星可能功能和用途是不相同的，一般卫星可以分为通信卫星、气象卫星、资源卫星、侦查卫星、导航卫星等。卫星在轨道上的姿态并不是固定的，卫星是通过调整不同的姿态来获取不同的信息。现阶段，每个卫星都会有一个固定的控制算法来确定卫星的姿态。

发明内容

有鉴于此，本申请的目的在于提供一种卫星姿态的控制方法、控制装置、计算机设备和介质，用于解决现有技术中无法准确对目标卫星进行姿态调整的问题。

第一方面，本申请实施例提供了一种卫星姿态的控制方法，包括：

获取目标卫星的上一时刻运行信息和目标姿态角；

将所述目标姿态角和上一时刻运行信息输入至实时调参的强化学习网络，计算得到所述目标卫星中动量轮在当前时刻的控制参数值；

根据计算得到的所述当前时刻的控制参数值，调整所述目标卫星的当前时刻姿态角，以使所述目标卫星向着所述目标姿态角运行。

可选的，所述控制方法还包括：

获取所述目标卫星在所述动量轮调整控制参数值后的当前时刻运行信息，若所述当前时刻运行信息中的当前时刻姿态角非所述目标姿态角，则对所述强化学习网络中的参数进行调整；

将当前时刻运行信息中的运行信息作为新的上一时刻运行信息，将调整参数后的强化学习网络作为新的强化学习网络，重新执行步骤将所述目标姿态角和新的上一时刻运行信息输入至新的强化学习网络，计算得到所述目标卫星的动量轮在新的当前时刻的控制参数值，步骤根据计算得到的所述新的当前时刻的控制参数值，调整所述目标卫星的当前时刻姿态角，以使所述目标卫星向着所述目标姿态角运行，以及获取所述目标卫星在所述动量轮调整控制参数值后的当前时刻运行信息，若所述当前时刻运行信息中的当前时刻姿态角非所述目标姿态角，则对所述强化学习网络中的参数进行调整，直至所述目标卫星的调整后的姿态角为目标姿态角。

可选的，所述当前时刻动量轮的控制参数值与所述上一时刻运行信息中动量轮的控制参数值之间的差值小于预设参数变化量。

可选的，所述控制方法还包括：

将所述上一时刻运行信息、所述当前时刻运行信息、目标姿态角、动作类别和奖励值作为一组经验数据存储在所述实时调参的强化学习网络的经验池中。

可选的，所述对强化学习网络的调参过程包括：

从经验池中随机采样，得到多个历史经验数据；

利用所述多个历史经验数据和损失函数，对强化学习网络中两个动作价值网络和演员网络进行参数调整。

可选的，所述奖励值是通过如下步骤确定的：

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所，未经中国科学院软件研究所许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202210356520.0/2.html，转载请声明来源钻瓜专利网。