[发明专利]一种煤矿自主巡检平台上的机械臂运动规划方法和装置在审
申请号: | 202210127986.3 | 申请日: | 2022-02-11 |
公开(公告)号: | CN114367988A | 公开(公告)日: | 2022-04-19 |
发明(设计)人: | 付鑫;王海军;杨晓辉;王洪磊;孟繁悦;吴太晖 | 申请(专利权)人: | 煤炭科学研究总院有限公司 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 北京清亦华知识产权代理事务所(普通合伙) 11201 | 代理人: | 杜月 |
地址: | 100020 北*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 煤矿 自主 巡检 平台 机械 运动 规划 方法 装置 | ||
1.一种煤矿自主巡检平台上机械臂运动规划方法,其特征在于,包括以下步骤:
检测机械臂可达范围内的障碍物;
对所述障碍物进行体素化处理,获得所述障碍物的体素向量;
获取所述机械臂的目标位姿向量和所述机械臂当前时刻的关节角度向量;
将所述体素向量、所述机械臂的目标位姿向量和所述机械臂当前时刻的关节角度向量输入至预先训练的运动规划器,获得所述机械臂下一时刻的关节角度变化量;
根据所述机械臂下一时刻的关节角度变化量,控制所述机械臂完成下一步动作。
2.根据权利要求1所述的方法,其特征在于,所述运动规划器通过以下步骤预先训练得到:
创建仿真环境;
观察所述仿真环境中机械臂样本当前时刻的关节角度向量、所述机械臂样本的目标位姿向量和障碍物样本当前时刻的体素向量,并获得所述机械臂样本下一时刻的关节角度变化量;
在所述仿真环境中根据所述下一时刻的关节角度变化量,控制所述机械臂样本完成下一步运动;
观察执行所述下一步动作之后的所述机械臂样本的状态和所述障碍物样本状态、奖励信号和任务终止信号;
将执行所述下一步动作之后的所述机械臂样本的状态确定为所述机械臂样本下一时刻的关节角度向量,并将执行所述下一步动作之后的所述障碍物样本状态确定为所述障碍物样本下一时刻的体素向量;
将所述机械臂样本当前时刻的关节角度向量、所述机械臂样本的目标位姿向量和所述障碍物样本当前时刻的体素向量、所述机械臂样本下一时刻执行的动作、所述机械臂样本下一时刻的关节角度向量、所述障碍物样本下一时刻的体素向量、所述奖励信号和任务终止信号,作为训练数据;
基于强化学习算法,采用所述训练数据对策略神经网络的参数进行更新,获得所述策略神经网络的模型参数,并根据所述模型参数生成所述运动规划器。
3.根据权利要求2所述的方法,其特征在于,所述基于强化学习算法,采用所述训练数据对策略神经网络的参数进行更新,包括:
根据所述训练数据,计算Q神经网络训练标签;
根据所述训练数据,计算Q神经网络预测数据;
根据所述Q神经网络训练标签和所述Q神经网络预测数据,计算所述Q神经网络的梯度向量;
根据所述Q神经网络的梯度向量,更新策略神经网络的参数。
4.根据权利要求3所述的方法,其特征在于,所述根据所述Q神经网络的梯度向量,更新策略神经网络的参数,包括:
根据所述Q神经网络的梯度向量,更新所述Q神经网络函数值;
根据所述Q神经网络函数值,所述更新策略神经网络的参数。
5.根据权利要求3或4所述的方法,其特征在于,所述Q神经网络训练标签通过以下公式计算:
其中,r为所述奖励信号;sˊ为下一时刻的状态向量,包括所述机械臂样本下一时刻的关节角度向量、所述障碍物样本下一时刻的体素向量和所述机械臂样本的目标位姿向量;d为所述任务终止信号;γ为第一折扣系数,其中γ的范围为0~1;为将所述下一时刻的状态向量sˊ输入至策略神经网络后做出的动作;为第i个Q神经网络在所述下一时刻的状态向量sˊ下做出所述动作的概率;α为第二折扣系数;为所述策略神经网络在所述下一时刻的状态向量sˊ下做出所述动作的概率。
6.一种煤矿自主巡检平台上机械臂运动规划装置,其特征在于,包括:
检测模块,用于检测机械臂可达范围内的障碍物;
处理模块,用于对所述障碍物进行体素化处理,获得所述障碍物的体素向量;
获取模块,用于获取所述机械臂的目标位姿向量和所述机械臂当前时刻的关节角度向量;
规划模块,用于将所述体素向量、所述机械臂的目标位姿向量和所述机械臂当前时刻的关节角度向量输入至预先训练的运动规划器,获得所述机械臂下一时刻的关节角度变化量;
控制模块,用于根据所述机械臂下一时刻的关节角度变化量,控制所述机械臂完成下一步动作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于煤炭科学研究总院有限公司,未经煤炭科学研究总院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210127986.3/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种传感器外壳加工用打孔装置
- 下一篇:一种智能手机支架