[发明专利]一种基于深度强化学习的冗余机械臂可操作度优化方法及装置有效
申请号: | 202210272600.8 | 申请日: | 2022-03-18 |
公开(公告)号: | CN114800488B | 公开(公告)日: | 2023-06-20 |
发明(设计)人: | 梁斌;王学谦;杨皓强;孟得山 | 申请(专利权)人: | 清华大学深圳国际研究生院 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 深圳新创友知识产权代理有限公司 44223 | 代理人: | 江耀纯 |
地址: | 518055 广东省深圳市*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于深度强化学习的冗余机械臂可操作度优化方法,其特征在于,包括用强化学习方法完成在固定复位机制下冗余机械臂对随机目标的接近训练;继续用强化学习方法完成在随机复位机制下冗余机械臂对随机目标的接近训练;其中“随机复位”是指让机械臂处于随机状态;在奖励函数中加“可操作度”项,并增加“可操作度”项的系数,再次用强化学习方法完成对冗余机械臂可操作度的优化;用优化后的算法对冗余机械臂进行控制。本发明通过首次使用带有可操作度奖励的强化学习方法来训练机械臂,使得机械臂在具备末端轨迹跟踪能力的同时,具备自动优化可操作度的能力,并且具备很好的通用性,能够对各种复杂的机器人结构进行训练。 | ||
搜索关键词: | 一种 基于 深度 强化 学习 冗余 机械 可操作 优化 方法 装置 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学深圳国际研究生院,未经清华大学深圳国际研究生院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202210272600.8/,转载请声明来源钻瓜专利网。
- 上一篇:一种用于合金制品生产的打磨装置
- 下一篇:一种人脑受电磁辐射的高精度计算方法