[发明专利]一种基于改进DQN算法的室内巡逻机器人自主导航方法在审
申请号: | 202210020980.6 | 申请日: | 2022-01-10 |
公开(公告)号: | CN114706379A | 公开(公告)日: | 2022-07-05 |
发明(设计)人: | 毛树人;郑剑锋;周海翔;吴振裕;孔鹏程 | 申请(专利权)人: | 常州大学 |
主分类号: | G05D1/02 | 分类号: | G05D1/02 |
代理公司: | 常州市英诺创信专利代理事务所(普通合伙) 32258 | 代理人: | 杨闯 |
地址: | 213164 江*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 改进 dqn 算法 室内 巡逻 机器人 自主 导航 方法 | ||
1.一种基于改进DQN算法的室内巡逻机器人自主导航方法,其特征在于,包括以下步骤:
S1、巡逻机器人感知自身周围的环境信息,并结合自身的位置信息和将到达的目标点组成一个状态空间,在状态空间中依次设置若干目标点,并作为DQN算法的输入;
S2、通过对DQN算法的目标函数进行改进,使巡逻机器人以当前位置和速度作为下一步动作的输出,当到达第一目标点后,以第一个目标点为起始点寻找下一个目标点,依次不断循环,直至找到最后一个目标点;
S3、改进DQN算法的奖惩函数r,提高DQN算法收敛速度,优化环境状态空间的奖惩稀疏性。
2.根据权利要求1所述的基于改进DQN算法的室内巡逻机器人自主导航方法,其特征在于,所述奖惩函数r的公式为:
其中,(i,j)为网格中横纵坐标,μ是特殊奖惩值;特殊奖惩点的r(m,n)特点为:以此点为中心,包括周围的8个点共9个点均不是障碍点;
特殊奖惩值μ,取值范围10-6~0,μ初始值10-6,μ按照两个连续目标点对应的路径数均分后递减,直到变成0。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于常州大学,未经常州大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210020980.6/1.html,转载请声明来源钻瓜专利网。