[发明专利]一种基于深度强化学习的六足机器人复杂地形自适应运动控制方法在审

专利信息
申请号: 201810226656.3 申请日: 2018-03-19
公开(公告)号: CN108536011A 公开(公告)日: 2018-09-14
发明(设计)人: 吴贺俊;林小强 申请(专利权)人: 中山大学
主分类号: G05B13/04 分类号: G05B13/04
代理公司: 广州粤高专利商标代理有限公司 44102 代理人: 林丽明
地址: 510275 广东*** 国省代码: 广东;44
权利要求书: 查看更多 说明书: 查看更多
摘要: 发明提供了一种基于深度强化学习的六足机器人复杂地形自适应运动控制方法,该方法相较于传统的通过预先编程实现机器人的运动控制的方式,本发明使用了深度强化学习,让机器人能够根据环境的复杂变化情况,自适应的调整运动策略,提高了在复杂环境下的“存活率”和适应能力;同时,相较于单一的actor‑critic深度强化学习架构,本方法实现了多actor‑多critic的深度强化学习架构,在训练深度神经网络时,能够加快训练,更快的收敛神经网络。
搜索关键词: 强化学习 运动控制 自适应 六足机器人 复杂地形 神经网络 机器人 架构 调整运动 复杂环境 预先编程 存活率 传统的 收敛
【主权项】:
1.一种基于深度强化学习的六足机器人复杂地形自适应运动控制方法,其特征在于:包括以下步骤:S1.由四轴飞行器通过俯视摄像头获取复杂环境的地形信息,并根据环境地形信息,以六足机器人当前的所在位置为起点,设置一个终点,规划运动轨迹,并传递给六足机器人;S2.六足机器人通过安装在机体上的RGB摄像头获取机体周围的环境照片,记为D1,以及通过六足机器人机体上装有的传感器获取机体当前的状态信息,包括线速度、角速度、六足机器人在三维空间中的姿态表示四元数、还有每个腿部关节自由度的角度,记为D2;S3.六足机器人通过预先训练过的基于行动‑评价架构的深度神经网络对机体周围的复杂地形环境照片和六足机器人自身当前的状态信息进行数据融合、降维和特征的提取;S4. 六足机器人根据数据融合、降维和特征提取的结果得出六足机器人的运动控制策略,然后在整体运动轨迹的基础上,根据控制策略来控制六足机器人每条腿上每个正常工作的关节驱动机构来完成关节的自由度运动,从而实现六足机器人即使一两个关节自由度出现问题的情况下,也能完成复杂地形环境的自适应运动。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/patent/201810226656.3/,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top