[发明专利]一种情景记忆引导的机器人操作技能高效学习方法有效

专利信息
申请号: 202111515059.0 申请日: 2021-12-13
公开(公告)号: CN114161419B 公开(公告)日: 2023-09-15
发明(设计)人: 刘冬;王子途;丛明 申请(专利权)人: 大连理工大学
主分类号: B25J9/16 分类号: B25J9/16;B25J11/00
代理公司: 辽宁鸿文知识产权代理有限公司 21102 代理人: 苗青;王海波
地址: 116024 辽*** 国省代码: 辽宁;21
权利要求书: 查看更多 说明书: 查看更多
摘要:
搜索关键词: 一种 情景 记忆 引导 机器人 操作技能 高效 学习方法
【权利要求书】:

1.一种情景记忆引导的机器人操作技能高效学习方法,其特征在于,所述学习方法包括以下步骤:

步骤1:建立机器人学习情景记忆模型M;

提出基于机器人技能的事件建模方式;机器人情景记忆模型M,M由不同的事件e构成,即M={e1,e2,e3,…ei},其中每个事件e由四元组ot,at,rt,ot+1表示,M中每个单元的构成与深度强化学习中表述状态的四元组的结构相同;其中,ot是由t时刻的环境状态st和机器人状态pt所编码成的场景信息,st是机器人通过传感器获得的环境状态,pt是包含机器人位姿状态、关节角度或其他机器人状态;at是机器人在环境状态st下执行的动作,在时间维度上表示机器人在当前任务采取的动作序列;rt是环境和学习策略在机器人执行动作后给出的奖励值;单一事件可以表示为et,机器人通过执行动作at,从环境状态st步入到环境状态st+1,环境和学习策略共同对机器人的表现做出评价,给出对应的奖赏值rt

步骤2:构建情景记忆模型检索算法;

机器人在情景记忆模型M中检索与当前场景信息相匹配的所有事件集合E,具体为:采用余弦距离作为相似性度量函数,由任务编码器将当前环境状态与机器人状态编码为场景信息ot,通过计算ot与情景记忆模型M中存储事件的场景信息om之间的向量相似性,选取情景记忆模型中所有相匹配的事件作为事件集合E:

D(ot,om)=(ot*om)/(‖ot‖*‖om‖)           (1)

当D(ot,om)大于设定阈值时,认为当前场景在记忆中存在,认为机器人经历过相类似场景和事件,情景记忆中包含om的事件将被提取到E中;当D(ot,om)小于阈值时,则认为情景记忆模型中存在的事件与当前场景信息不匹配;

步骤3:根据情景记忆模型引导深度强化学习的动作选择;

机器人传感器捕获当前环境状态st和机器人状态pt,将st和pt编码为场景信息ot,根据步骤2获取事件集合E,在事件集合中提取拥有最大奖赏值的动作为am;由深度强化学习的策略网络生成动作aπ,机器人在am和aπ中选择最终作用于环境的动作at

步骤4:深度强化学习环境进行迭代;

机器人执行在步骤3中选择的动作at,机器人所处环境在机器人执行动作后发生改变,环境状态由st步入到st+1,同时,机器人状态由pt变为pt+1,深度强化学习的评价网络根据环境状态st+1给出对应的环境奖赏值rt,如果机器人完成任务目标,rt为1,否则为0;

步骤5:更新情景记忆模型;

机器人使用环境状态st+1和机器人状态pt+1构成当前时刻的场景信息ot+1,以ot+1作为索引,使用步骤2中的检索方法,在情景记忆模型中检索相匹配的事件集合E,并设置记忆奖赏值如果E为空,则将设置为0,如果E不为空,则提取E中的最大奖赏值作为

使用步骤4获得的环境奖赏值rt和更新情景记忆模型:如果rt等于1,则将表示事件的四元组{ot,at,rt,ot+1}添加到情景记忆模型M中;如果rt等于0,由于st和st+1之间的状态转移关系,使用乘上一个折扣因子α来替代rt

并将四元组{ot,at,rt,ot+1}添加到情景记忆模型M中;在情景记忆模型M更新之后,将表示事件的四元组{st,at,rt,st+1}写入深度强化学习算法的经验回放缓存;之后,学习过程将进入下一次迭代,回到步骤3进行重复,直至训练步数完成。

下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。

该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于大连理工大学,未经大连理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服

本文链接:http://www.vipzhuanli.com/pat/books/202111515059.0/1.html,转载请声明来源钻瓜专利网。

×

专利文献下载

说明:

1、专利原文基于中国国家知识产权局专利说明书;

2、支持发明专利 、实用新型专利、外观设计专利(升级中);

3、专利数据每周两次同步更新,支持Adobe PDF格式;

4、内容包括专利技术的结构示意图流程工艺图技术构造图

5、已全新升级为极速版,下载速度显著提升!欢迎使用!

请您登陆后,进行下载,点击【登陆】 【注册】

关于我们 寻求报道 投稿须知 广告合作 版权声明 网站地图 友情链接 企业标识 联系我们

钻瓜专利网在线咨询

周一至周五 9:00-18:00

咨询在线客服咨询在线客服
tel code back_top