[发明专利]基于离线模型预训练学习的DDPG算法的机器人控制方法有效
申请号: | 202011429368.1 | 申请日: | 2020-12-07 |
公开(公告)号: | CN112668235B | 公开(公告)日: | 2022-12-09 |
发明(设计)人: | 张茜;王洪格;姚中原;戚续博 | 申请(专利权)人: | 中原工学院 |
主分类号: | G06F30/27 | 分类号: | G06F30/27;G06N3/04;G06N3/08;G06F111/08;G06F111/10 |
代理公司: | 郑州优盾知识产权代理有限公司 41125 | 代理人: | 栗改 |
地址: | 451191 河南省郑*** | 国省代码: | 河南;41 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明提出了一种基于离线模型预训练学习的DDPG算法的机器人控制方法,其步骤如下:收集离线环境下2D假人的训练数据,对训练数据进行预处理得到训练数据集;构建并初始化人工神经网络并初始化参数;利用训练数据集离线预训练评估网络和动作网络;利用预训练后的评估网络初始化目标网络,智能体将状态转换数据存入存储缓冲器作为训练在线网络的在线数据集;利用在线数据集训练在线策略网络和在线Q网络,利用DDQN结构更新在线策略网络和在线Q网络;软更新,控制2D假人的状态。本发明效率更高效,产生的Q值更加精确,平均奖励值更高,学习策略更加稳定可靠,提高了收敛速度和获取的累积奖励值达到更高水平,使机器人快速地到达目的地。 | ||
搜索关键词: | 基于 离线 模型 训练 学习 ddpg 算法 机器人 控制 方法 | ||
【主权项】:
暂无信息
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中原工学院,未经中原工学院许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/202011429368.1/,转载请声明来源钻瓜专利网。
- 上一篇:一种建筑废料粉碎装置
- 下一篇:一种医疗器械用线路收纳支架