[发明专利]一种基于深度Q学习的智能水下机器人行为体系结规划方法有效
申请号: | 201810759163.6 | 申请日: | 2018-07-11 |
公开(公告)号: | CN108873687B | 公开(公告)日: | 2020-06-26 |
发明(设计)人: | 孙玉山;冉祥瑞;张国成;盛明伟;万磊;王力锋;程俊涵;焦文龙;王子楷;吴凡宇 | 申请(专利权)人: | 哈尔滨工程大学 |
主分类号: | G05B13/02 | 分类号: | G05B13/02;G05B13/04;G05B17/02;G05D1/00;G05D1/10 |
代理公司: | 哈尔滨市松花江专利商标事务所 23109 | 代理人: | 岳泉清 |
地址: | 150001 黑龙江省哈尔滨市南岗区*** | 国省代码: | 黑龙江;23 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明属于水下机器人技术领域,具体设计一种基于深度Q学习的智能水下机器人行为体系结构规划方法。包括:AUV行为规划体系结构分层设计;基于深度Q学习的行为规划及动作规划策略设计。主要流程为:将AUV的行为规划体系结构划分为“任务‑行为‑动作”三个层次,首先任务分解层将AUV收到的任务指令分解为各个行为,然后行为规划层通过获取到的环境信息对完成任务所需要的行为进行规划,最后动作执行层利用Q学习的方法训练AUV完成最优动作规划,通过控制AUV执行机构产生动作达到目标指令。本方法利用强化学习的方法训练水下机器人,使AUV能够在真实的动态水下环境中实现自主行为规划,省去了大量逻辑编程,提高了水下机器人的智能性。 | ||
搜索关键词: | 一种 基于 深度 学习 智能 水下 机器人 行为 体系 规划 方法 | ||
【主权项】:
1.一种基于深度Q学习的智能水下机器人行为体系结构规划方法,其特征在于,包括以下步骤:步骤1:AUV行为规划体系结构分层设计;步骤2:基于深度Q学习的行为规划及动作规划策略设计。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于哈尔滨工程大学,未经哈尔滨工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810759163.6/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于串联弹性驱动器的控制方法
- 下一篇:一种化工工业过程性能保持控制方法