[发明专利]一种仿蛇搜救机器人适应性步态自主涌现方法有效
申请号: | 201811596803.2 | 申请日: | 2018-12-26 |
公开(公告)号: | CN109719721B | 公开(公告)日: | 2020-07-24 |
发明(设计)人: | 曹政才;肖清;黄冉;胡标;张东;耿鹏;李俊宽 | 申请(专利权)人: | 北京化工大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 北京思海天达知识产权代理有限公司 11203 | 代理人: | 沈波 |
地址: | 100029 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种仿蛇搜救机器人适应性步态自主涌现方法,针对仿蛇搜救机器人的特殊机械结构及其所处复杂动态非结构环境,使用深度强化学习理论设计相应的步态自主学习方法。此方法应用于仿蛇搜救机器人,可以通过不断从环境中获取信息生成最优控制策略,实现在复杂非结构的救援现场中仿蛇搜救机器人的适应性步态自主涌现。该方法使用分布式并行近似策略优化,将多个仿蛇搜救机器人间策略经验相互共享,实现对未知救援环境的快速适应性学习。本发明解决传统强化学习方法不能适应复杂非结构环境以及算法收敛速度慢、稳定性差等问题,更切合实际,能够使仿蛇搜救机器人在搜救任务中自主生成适应性最优步态。 | ||
搜索关键词: | 一种 搜救 机器人 适应性 步态 自主 涌现 方法 | ||
【主权项】:
1.一种仿蛇搜救机器人适应性步态自主涌现方法,其特征在于:包含以下步骤:步骤1.1基于动态高斯参数空间探索机理,构建用于仿蛇搜救机器人步态生成的深度高斯策略网络,以及用于评价控制策略优劣的深度高斯估值网络;步骤1.2建立仿蛇搜救机器人经验共享体系,使用异步并行经验共享池收集多个机器人从搜救任务获取的信息、对应奖赏信号及其自身位姿关节状态信息;步骤1.3设计基于策略梯度估计的本地近似策略优化器,对步骤1.1中的深度高斯策略网络进行训练,得到局部优化的仿蛇搜救机器人步态控制策略;步骤1.4根据步骤1.2中的异步经验共享池与步骤1.3的本地近似策略优化器,构建仿蛇搜救机器人全局策略优化器,针对当前对应的搜救环境信息对多个机器人的本地策略优化进行全局优化调整,生成相应的最优适应性步态,完成整个仿蛇搜救机器人适应性步态自主涌现方法的设计。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京化工大学,未经北京化工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811596803.2/,转载请声明来源钻瓜专利网。