[发明专利]面向空间博弈的自主驱离方法、装置和存储介质有效
申请号: | 202110450161.0 | 申请日: | 2021-04-25 |
公开(公告)号: | CN113353289B | 公开(公告)日: | 2022-12-13 |
发明(设计)人: | 黄煌;刘磊;魏春岭;石恒;黄盘兴;范清春 | 申请(专利权)人: | 北京控制工程研究所 |
主分类号: | B64G1/24 | 分类号: | B64G1/24 |
代理公司: | 中国航天科技专利中心 11009 | 代理人: | 陈鹏 |
地址: | 100080 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 空间 博弈 自主 方法 装置 存储 介质 | ||
1.一种面向空间博弈的自主驱离方法,其特征在于,包括,
选取一护卫星作为第一航天器和第二航天器的参照点,获取第二航天器的预定的水滴运动轨迹,在仿真环境中建立CW轨道相对运动学模型,所述参照点为所述CW轨道相对运动学模型的坐标系的原点,所述CW轨道相对运动学模型用于描述所述第二航天器的水滴运动轨迹和所述第一航天器的运动轨迹;
从所述CW轨道相对运动学模型中获取t0时刻第一航天器和第二航天器的观测量,根据所述水滴运动轨迹获取所述第二航天器的速度增量,所述观测量包括:位置信息和速度信息;
将所述t0时刻第一航天器的观测量输入到训练效果收敛的动作网络计算t0时刻所述第一航天器的速度增量,根据所述速度增量对所述第一航天器的轨道进行控制,所述速度增量包括所述CW轨道相对运动学模型x、y、z轴三个方向的速度增量;
根据t0时刻第一航天器的观测量和速度增量,利用CW方程计算t0+T时刻第一航天器观测量,根据所述t0时刻第二航天器的观测量和速度增量,利用所述CW方程获取t0+T时刻所述第二航天器的观测量,T为控制周期;
根据t0+T时刻所述第一航天器和第二航天器的观测量,计算t0+T时刻所述第一航天器和第二航天器之间的距离,当距离小于预定值时,判定成功驱离所述第二航天器。
2.根据权利要求1所述的方法,其特征在于,进一步包括,
获取所述第一航天器及第二航天器多个时刻的观测量和速度增量;
根据所述多个时刻中每个时刻所述第一航天器和第二航天器之间的距离确定对应时刻所述第一航天器的即时奖励函数;
根据所述多个时刻中每个时刻对应的观测量、速度增量、即时奖励函数、MADDPG算法和超参数在所述仿真环境中对所述第一航天器的初始动作网络和初始评价网络进行训练调整得到训练效果收敛的所述动作网络和评价网络,所述训练效果收敛的所述动作网络和评价网络的权值更新量小于预设值,所述超参数包括:学习率、长期回报折扣因子、每次训练次数和批学习数据量。
3.根据权利要求1所述的方法,其特征在于,
所述z轴垂直向下指向地心,y轴垂直于所述护卫星的轨道平面,x轴根据右手直角坐标系定义。
4.根据权利要求2所述的方法,其特征在于,根据所述多个时刻中每个时刻所述第一航天器和第二航天器之间的距离确定对应时刻所述第一航天器的即时奖励函数包括:
当第一航天器与第二航天器相对距离不大于3公里时,将即时奖励函数的值设定为固定值;
当第一航天器与第二航天器相对距离大于3公里时,即时奖励函数的值根据第一航天器与第二航天器之间的相对距离进行设置,具体为,
式中,x为第一航天器与第二航天器之间的相对距离。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京控制工程研究所,未经北京控制工程研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202110450161.0/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种大数据AI智能监控系统
- 下一篇:一种基于预约申请时隙的卫星接入方法