[发明专利]一种卫星姿态的控制方法、控制装置、计算机设备和介质在审
申请号: | 202210356520.0 | 申请日: | 2022-03-30 |
公开(公告)号: | CN114889848A | 公开(公告)日: | 2022-08-12 |
发明(设计)人: | 赵军锁;朱捷;吴凤鸽;乔鹏 | 申请(专利权)人: | 中国科学院软件研究所 |
主分类号: | B64G1/24 | 分类号: | B64G1/24 |
代理公司: | 北京超凡宏宇专利代理事务所(特殊普通合伙) 11463 | 代理人: | 彭星 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 卫星 姿态 控制 方法 装置 计算机 设备 介质 | ||
1.一种卫星姿态的控制方法,其特征在于,包括:
获取目标卫星的上一时刻运行信息和目标姿态角;
将所述目标姿态角和上一时刻运行信息输入至实时调参的强化学习网络,计算得到所述目标卫星中动量轮在当前时刻的控制参数值;
根据计算得到的所述当前时刻的控制参数值,调整所述目标卫星的当前时刻姿态角,以使所述目标卫星向着所述目标姿态角运行。
2.根据权利要求1所述的控制方法,其特征在于,所述控制方法还包括:
获取所述目标卫星在所述动量轮调整控制参数值后的当前时刻运行信息,若所述当前时刻运行信息中的当前时刻姿态角非所述目标姿态角,则对所述强化学习网络中的参数进行调整;
将当前时刻运行信息中的运行信息作为新的上一时刻运行信息,将调整参数后的强化学习网络作为新的强化学习网络,重新执行步骤将所述目标姿态角和新的上一时刻运行信息输入至新的强化学习网络,计算得到所述目标卫星的动量轮在新的当前时刻的控制参数值,步骤根据计算得到的所述新的当前时刻的控制参数值,调整所述目标卫星的当前时刻姿态角,以使所述目标卫星向着所述目标姿态角运行,以及获取所述目标卫星在所述动量轮调整控制参数值后的当前时刻运行信息,若所述当前时刻运行信息中的当前时刻姿态角非所述目标姿态角,则对所述强化学习网络中的参数进行调整,直至所述目标卫星的调整后的姿态角为目标姿态角。
3.根据权利要求1所述的控制方法,其特征在于,所述当前时刻动量轮的控制参数值与所述上一时刻运行信息中动量轮的控制参数值之间的差值小于预设参数变化量。
4.根据权利要求2所述的控制方法,其特征在于,所述控制方法还包括:
将所述上一时刻运行信息、所述当前时刻运行信息、目标姿态角、动作类别和奖励值作为一组经验数据存储在所述实时调参的强化学习网络的经验池中。
5.根据权利要求4所述的控制方法,其特征在于,所述对强化学习网络的调参过程包括:
从经验池中随机采样,得到多个历史经验数据;
利用所述多个历史经验数据和损失函数,对强化学习网络中两个动作价值网络和演员网络进行参数调整。
6.根据权利要求4所述的控制方法,其特征在于,所述奖励值是通过如下步骤确定的:
利用所述经验数据中的当前时刻运行信息的姿态角与所述目标姿态角的差,确定奖励值。
7.根据权利要求4所述的控制方法,其特征在于,所述动作类别是根据当前时刻运行信息中的转速与上一时刻运行信息中的上一时刻转速的比较结果确定的。
8.一种卫星姿态的控制装置,其特征在于,包括:
获取模块,用于获取目标卫星的上一时刻运行信息和目标姿态角;
计算模块,用于将所述目标姿态角和上一时刻运行信息输入至实时调参的强化学习网络,计算得到所述目标卫星中动量轮在当前时刻的控制参数值;
调整模块,用于根据计算得到的所述当前时刻的控制参数值,调整所述目标卫星的当前时刻姿态角,以使所述目标卫星向着所述目标姿态角运行。
9.一种计算机设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-7中任一项所述的方法的步骤。
10.一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,其特征在于,所述计算机程序被处理器运行时执行上述权利要求1-7中任一项所述的方法的步骤。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院软件研究所,未经中国科学院软件研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210356520.0/1.html,转载请声明来源钻瓜专利网。