[发明专利]一种基于深度强化学习TD3算法的机械臂运动控制方法有效
| 申请号: | 202111211310.4 | 申请日: | 2021-10-18 |
| 公开(公告)号: | CN113843802B | 公开(公告)日: | 2023-09-05 |
| 发明(设计)人: | 廖文和;徐畅;杨海波 | 申请(专利权)人: | 南京理工大学 |
| 主分类号: | B25J9/16 | 分类号: | B25J9/16 |
| 代理公司: | 南京理工大学专利中心 32203 | 代理人: | 张玲 |
| 地址: | 210094 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开一种基于深度强化学习的机械臂运动控制方法。包括如下步骤:(1):建立机械臂的三维仿真环境;包括初始化机械臂环境,重置机械臂环境,设定机械臂更新步骤,设定奖励函数,渲染机械臂环境,对实验进行随机种子的设置和关闭机械臂环境;(2):在采用添加目标动作噪声衰减的深度强化学习算法TD3来对机械臂运动控制进行训练,TD3使用两个独立的评论家网络,使用值函数剪裁以及延迟策略更新,训练得到控制策略模型;(3):评估模型的效果。本发明通过加入动作探索噪声和目标网络噪声,平滑动作,有效缩短训练时间,收敛速度大幅度的增强;通过双评论家网络降低过高的估计值,降低误差积累,降低收敛失败的几率。 | ||
| 搜索关键词: | 一种 基于 深度 强化 学习 td3 算法 机械 运动 控制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京理工大学,未经南京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202111211310.4/,转载请声明来源钻瓜专利网。
- 上一篇:装配流水线及其钩具
- 下一篇:用于物料分拣的多吸盘可移动机械手及其控制系统





