[发明专利]不依赖动态模型参数的无人潜航器切换拓扑编队控制方法有效
| 申请号: | 202310152588.1 | 申请日: | 2023-02-23 |
| 公开(公告)号: | CN115826594B | 公开(公告)日: | 2023-05-30 |
| 发明(设计)人: | 刘昊;吕金虎;鲁伟;高庆;刘德元;王振乾;钟森 | 申请(专利权)人: | 北京航空航天大学;中国科学院数学与系统科学研究院 |
| 主分类号: | G05D1/06 | 分类号: | G05D1/06 |
| 代理公司: | 北京天汇航智知识产权代理事务所(普通合伙) 11987 | 代理人: | 高永 |
| 地址: | 100191*** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 不依赖 动态 模型 参数 无人 潜航 切换 拓扑 编队 控制 方法 | ||
本发明公开了一种不依赖动态模型参数的无人潜航器切换拓扑编队控制方法,包括步骤:综合潜航器的位姿动力学特性、系统模型误差以及环境误差扰动信息,建立潜航器动力学模型;根据潜航器编队成员的相邻情况以及通信方向,建立基于图论的潜航器编队通信拓扑图;根据潜航器动力学模型以及编队成员间的信息流向构建分布式观测器;结合潜航器的位姿信息及分布式观测器,构造位姿控制器,求解位姿控制器的控制反馈输入量,得到不依赖动态参数的潜航器编队切换拓扑控制器。该方法利用强化学习算法基于数据进行参数辨识,可以不依赖系统动态模型参数实现编队控制;能够实现编队通信的变拓扑编队控制,有效提高潜航器成员间的信息利用率和任务容错率。
技术领域
本发明涉及无人潜航器控制技术领域,具体涉及一种不依赖动态模型参数的无人潜航器切换拓扑编队控制方法。
背景技术
一般而言,编队决策与控制借助智能体间的局部交互实现多智能体的群体行为,从而解决全局性的任务。多智能体之间必须要有信息交互才能确保其在编队中相对位置的不变,从而保持一定的队形。
现有文献中,编队控制的研究方法包括跟随领航者法、基于行为法、人工势场法、虚拟结构法、一致性方法和基于图论法等。目前,上述研究方法已经逐步混合在一起,难以绝对区分开,导致研究方法设计复杂,且难以适应不同场景。
在潜航器个体的姿态稳定控制器方面,现有方法包括自适应调节算法、强化学习算法、Linear quadratic regulator (LQR)最优控制算法以及传统变分法等,其中主流算法均需要依赖被控对象的精确模型信息,而由于载荷不同,实际被控对象模型必然存在误差,因此难以保证控制的鲁棒性与有效性。
发明内容
鉴于现有无人潜航器编队控制需要依赖编队个体的精确动态模型参数,否则无法实现有效控制,本发明将强化学习应用到无人潜航器系统中,设计强化学习算法基于数据进行参数辨识,通过求取Hamilton-Jacobi-Bellman(HJB)方程实时求取出最优控制器,可以在不依赖系统动态模型参数的情况下实现编队控制,而且在编队通信方面,本发明实现了编队通信的变拓扑编队控制,使得无人系统在执行任务中切换信号传输通路成为可能,以提高潜航器之间的信息利用率和任务容错率。本发明采用以下技术方案:
一种不依赖动态模型参数的无人潜航器切换拓扑编队控制方法,包括以下步骤:
步骤S1,综合潜航器的位姿动力学特性、系统模型误差以及环境误差扰动信息,建立潜航器动力学模型;
步骤S2,根据潜航器编队成员的相邻情况以及通信方向,建立基于图论的潜航器编队通信拓扑图,用于表征潜航器编队成员间的信息流向;
步骤S3,根据潜航器动力学模型以及潜航器编队成员间的信息流向构建分布式观测器,将其搭载于各潜航器编队成员,采集潜航器的位姿信息;
步骤S4,结合潜航器的位姿信息及分布式观测器的结构设计,构造位姿控制器,基于强化学习算法求解位姿控制器的控制反馈输入量,得到不依赖动态参数的潜航器编队切换拓扑控制器。
进一步,所述步骤S1,所述潜航器动力学模型为:
其中,为潜航器
进一步,所述步骤S2,所述基于图论的潜航器编队通信拓扑图为:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学;中国科学院数学与系统科学研究院,未经北京航空航天大学;中国科学院数学与系统科学研究院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310152588.1/2.html,转载请声明来源钻瓜专利网。
- 上一篇:一种数据处理方法、装置及设备
- 下一篇:一种便于对卷状牧草捆进行转移的搬运车





