[发明专利]基于环境最优艏向的水下机器人悬停强化学习控制方法在审
申请号: | 202310198702.4 | 申请日: | 2023-03-03 |
公开(公告)号: | CN116126000A | 公开(公告)日: | 2023-05-16 |
发明(设计)人: | 田玉平;赵月腾;刘崧;姚永琪;何猛 | 申请(专利权)人: | 杭州电子科技大学 |
主分类号: | G05D1/06 | 分类号: | G05D1/06 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 310018 浙江省杭*** | 国省代码: | 浙江;33 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于环境最优艏向的水下机器人悬停强化学习控制方法,包括以下步骤:步骤1、建立水下机器人运动学和动力学模型;步骤2、建立水下机器人与环境交互模型,并定义水下机器人的状态空间和动作空间;步骤3、利用环境最优艏向定位原理,对水下机器人与环境交互模型设置奖励函数和探索策略;步骤4、建立神经网络模型,采用深度确定性策略梯度算法对控制策略进行模型训练,得出水下机器人的控制策略参数;步骤5、根据控制策略参数实现悬停控制。该方法基于强化学习的控制器是一种不依赖于模型的控制方法,不需要精确的水动力系数,仅通过与环境的不断交互,便可以实现自主学习和自主决策,从而最终实现对水下机器人的悬停控制。 | ||
搜索关键词: | 基于 环境 最优 水下 机器人 悬停 强化 学习 控制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于杭州电子科技大学,未经杭州电子科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202310198702.4/,转载请声明来源钻瓜专利网。