[发明专利]不依赖动态模型参数的无人潜航器切换拓扑编队控制方法有效
| 申请号: | 202310152588.1 | 申请日: | 2023-02-23 |
| 公开(公告)号: | CN115826594B | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 刘昊;吕金虎;鲁伟;高庆;刘德元;王振乾;钟森 | 申请(专利权)人: | 北京航空航天大学;中国科学院数学与系统科学研究院 |
| 主分类号: | G05D1/06 | 分类号: | G05D1/06 |
| 代理公司: | 北京天汇航智知识产权代理事务所(普通合伙) 11987 | 代理人: | 高永 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 不依赖 动态 模型 参数 无人 潜航 切换 拓扑 编队 控制 方法 | ||
1.一种不依赖动态模型参数的无人潜航器切换拓扑编队控制方法,其特征在于,包括以下步骤:
步骤S1,综合潜航器的位姿动力学特性、系统模型误差以及环境误差扰动信息,建立潜航器动力学模型;
步骤S2,根据潜航器编队成员的相邻情况以及通信方向,建立基于图论的潜航器编队通信拓扑图,用于表征潜航器编队成员间的信息流向;
步骤S3,根据潜航器动力学模型以及潜航器编队成员间的信息流向构建分布式观测器,将其搭载于各潜航器编队成员,采集潜航器的位姿信息;
步骤S4,结合潜航器的位姿信息及分布式观测器的结构设计,构造位姿控制器,基于强化学习算法求解位姿控制器的控制反馈输入量,得到不依赖动态参数的潜航器编队切换拓扑控制器;
所述步骤S1,所述潜航器动力学模型为:
其中,为潜航器
所述步骤S2,所述基于图论的潜航器编队通信拓扑图为:
其中,为潜航器编队的拉普拉斯矩阵;为入度矩阵,其矩阵元素为与编队成员相邻的其他成员数量;为加权邻接矩阵,其矩阵元素为与编队成员构成通信网络的其他成员信息,满足主对角线系数,以及当编队成员间存在通信时,矩阵系数,
所述步骤S2,假设潜航器编队的编队中心为虚拟领导者,虚拟领导者以预设的轨迹航行,潜航器编队成员跟随虚拟领导者行进,虚拟领导者的动力学模型为:
其中,为虚拟领导者的位置以及速度;为虚拟领导者的动力学矩阵;令
所述步骤S2,定义潜航器同虚拟领导者的通信关系矩阵为,具体展开如下:
其中,为潜航器
所述步骤S3,所述分布式观测器为:
其中,为潜航器
所述步骤S4,所述位姿控制器为:
其中,为控制输入量,是初值的连续函数;为潜航器状态向量;
所述步骤S4,
设置扰动衰减条件:
其中,参数表示一个正的常数,矩阵,矩阵以及参数;为控制误差,为控制输入量,为正项常数;当满足该扰动衰减条件时,位置动态上的等效扰动对位置跟踪性能的影响至少可被衰减至的程度;
基于强化学习算法求解HJB方程进而获得,其中HJB方程如下:
其中,上标*表示最优解,为性能函数,为控制输入量,为等效扰动,为误差,和为对称矩阵,,为标称控制矩阵,为信息随时间的衰减系数,为正项常数,为标称误差矩阵,为标称动力学矩阵,为模型状态,为一个12行的列向量且第6行为1,为重力加速度。
2.根据权利要求1所述的不依赖动态模型参数的无人潜航器切换拓扑编队控制方法,其特征在于,所述强化学习算法的迭代方程如下:
其中,为时间,为采样间隔,上标
强化学习过程如下:
(1)初始化:在给定的位置动态等效扰动的影响下,对编队切换拓扑控制系统先给定一个包含探测噪声的控制输入量,并采集更新潜航器的状态数据、控制输入和等效扰动,并任意给定初始控制量以及等效扰动初始值;
(2)策略评估和策略更新:进行迭代,对于第
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;中国科学院数学与系统科学研究院,未经北京航空航天大学;中国科学院数学与系统科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310152588.1/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置及设备
- 下一篇:一种便于对卷状牧草捆进行转移的搬运车





