[发明专利]一种基于深度强化学习的机器人三维测量路径规划方法有效
申请号: | 202310864607.3 | 申请日: | 2023-07-14 |
公开(公告)号: | CN116604571B | 公开(公告)日: | 2023-10-27 |
发明(设计)人: | 王耀南;唐永鹏;谭浩然;冯运;张辉;谢核;彭伟星;吴昊天;刘学兵;毛建旭;朱青 | 申请(专利权)人: | 湖南大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16;G01C21/20 |
代理公司: | 长沙市护航专利代理事务所(特殊普通合伙) 43220 | 代理人: | 莫晓齐 |
地址: | 410082 湖*** | 国省代码: | 湖南;43 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 基于 深度 强化 学习 机器人 三维 测量 路径 规划 方法 | ||
1.一种基于深度强化学习的机器人三维测量路径规划方法,其特征在于,所述方法包括以下步骤:
S100:基于多层视球和下一最优视点的MLVS-NBV规划方法生成候选视点集合;
S200:使用IKFast运动学求解器求解候选视点集合中各视点对应的机器人的所有逆运动学解;
S300:建立视点—逆运动学解的评估矩阵;
S400:基于候选视点集合建立训练数据集,根据训练数据集对PC-NBV点云网络进行训练,基于训练后的PC-NBV点云网络学习和预测选择下一个视点后的覆盖率;
S500:将测量视点选择问题建模为GTSP问题,搭建基于DDQN的网络架构,根据评估矩阵、覆盖率预测矢量和视点遍历序列更新状态信息,根据更新后的状态信息结合DDQN强化学习方法求解GTSP问题,得到训练后的Q网络;
S600:将训练好的Q网络迁移到实际的机器人测量任务,根据观测信息生成下一个最优视点,使用GPMP2运动规划器生成无碰撞测量路径,控制机器人运动并扫描对象,直至到达预设的终止条件,结束测量。
2.根据权利要求1所述的方法,其特征在于,S100包括:
S110:构建多层视球并采样生成初始视点集合;
S120:分析标志点约束和初始视点集合中视点可行性,保留可行的视点;
S130:建立基于可视锥的下一最优视点规划策略,并增加对不同对象测量的视点;
S140:融合所有可行的测量视点生成候选视点集合。
3.根据权利要求2所述的方法,其特征在于,S110将每个视点定义为位置、方向和绕该方向相对旋转角度的元组,即,该视点的位姿计算如下:
;
;
;
;
其中,是单位矢量,是矢量的反对称矩阵;视点方向设定为视点坐标系的Z轴,即结构光三维扫描仪投影仪的光轴方向;为视点坐标系Z轴与测量对象坐标系Z轴的夹角;矢量旋转到矢量的旋转轴方向;为视点坐标系到测量对象坐标系的旋转变换矩阵;为视点相对于测量对象的位姿。
4.根据权利要求2所述的方法,其特征在于,S120采用虚拟测量技术模拟给定视点下观测到的标志点信息,通过分析观测到的标志点的数量和分布判断视点在视觉上是否可行,即,其中为要求观测到的标志点的最少数量,为要求观测到的标志点聚类的最少数量,按标志点支柱的中心线进行聚类,其聚类结果为标志点占用的支柱的最少数量;同时,S120通过分析逆运动学解是否存在、机器人关节角度是否满足关节位置限制、是否存在物理碰撞、是否具有一定的可操作性来分析视点在运动学上是否可行性,即,其中,为计算给定视点和采样转台角度下的机器人逆运动学解,和分别为机器人关节的最小关节位置和最大关节位置,为机器人的无碰撞关节空间,为机器人的雅可比矩阵,为规定的最小机器人可操作性;当给定的视点同时满足上述条件,则该视点是可行的,否则该视点是不可行的。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于湖南大学,未经湖南大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310864607.3/1.html,转载请声明来源钻瓜专利网。