[发明专利]一种基于障碍区域扩张策略的强化学习路径规划方法在审
| 申请号: | 201911012585.8 | 申请日: | 2019-10-23 |
| 公开(公告)号: | CN110726416A | 公开(公告)日: | 2020-01-24 |
| 发明(设计)人: | 陈海洋;张凯;季野彪 | 申请(专利权)人: | 西安工程大学 |
| 主分类号: | G01C21/34 | 分类号: | G01C21/34;G01C21/00 |
| 代理公司: | 61200 西安通大专利代理有限责任公司 | 代理人: | 李红霖 |
| 地址: | 710000 陕*** | 国省代码: | 陕西;61 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于障碍区域扩张策略的强化学习路径规划方法,属于路径规划方法技术领域。本发明的基于障碍区域扩张策略的强化学习路径规划方法,在使用强化学习方法进行路径规划时,学习的状态空间会随着环境的逐渐复杂变得庞大。本发明针对复杂环境下强化学习路径规划中智能体探索时间长,算法收敛速度慢的问题,对于环境中存在的凹形障碍区域,通过引入障碍区域扩张策略,既避免了智能体在探索环境时,陷入凹形障碍区域而反复徘徊的困境,同时,将障碍区域扩张后剔除,有效减小了强化学习中状态空间的维度,在明显少于传统方法的学习次数下规划出了最优路径。对于凹形障碍区域较多的地形,本发明提出的算法具有较大的优势。 | ||
| 搜索关键词: | 障碍区域 路径规划 强化学习 凹形 状态空间 智能体 复杂环境 算法收敛 最优路径 减小 算法 维度 剔除 地形 探索 学习 引入 规划 | ||
【主权项】:
1.一种基于障碍区域扩张策略的强化学习路径规划方法,其特征在于,包括以下步骤:/n1)根据智能体所处的工作环境,确定影响路径规划的因素数据;/n2)采集影响路径规划的因素数据并模糊分类,得到建立环境模型的基础数据;/n3)基于模糊分类后的基础数据,采用栅格法建立环境模型;/n4)基于环境模型中存在的凹形障碍区域,采用障碍区域扩张策略,得到环境模型中的障碍栅格;/n5)在智能体所处的工作环境中通过试错学习来获得奖赏值,从而规划出一条奖赏值最高的路径。/n
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于西安工程大学,未经西安工程大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201911012585.8/,转载请声明来源钻瓜专利网。





