[发明专利]机器人在观测受限下拾取及放置物体的任务规划方法及系统在审
申请号: | 202211729991.8 | 申请日: | 2022-12-30 |
公开(公告)号: | CN115958603A | 公开(公告)日: | 2023-04-14 |
发明(设计)人: | 陈卫东;赵文锐 | 申请(专利权)人: | 上海交通大学 |
主分类号: | B25J9/16 | 分类号: | B25J9/16 |
代理公司: | 上海段和段律师事务所 31334 | 代理人: | 郭国中 |
地址: | 200240 *** | 国省代码: | 上海;31 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 机器人 观测 受限 拾取 放置 物体 任务 规划 方法 系统 | ||
本发明提供了一种机器人在观测受限下拾取及放置物体的任务规划方法及系统,包括:步骤S1:对信念树搜索算法进行改进,包括:建立动作可行概率、基于动作可行概率设置信念树动作分枝扩展以及设置修正回报函数;步骤S2:利用改进后的信念树搜索算法进行任务与规划和执行。
技术领域
本发明涉及机器人任务规划技术领域,具体地,涉及机器人在观测受限下拾取及放置物体的任务规划方法及系统,用于安排机器人完成任务所需的动作序列,特别是在物体信息不完整的情况下对机器人拾取及放置物体任务的规划。
背景技术
很多情况下机器人需要通过多次拾取及放置不同物体来达到某一任务目标,比如将杂乱物体摆放整齐,或在杂乱物体中寻找目标物体。一般机器人拾放物体的任务规划算法假设完全已知所有物体的信息,包括每个物体的名称和位姿。当机器人只能通过自身观测来获取物体信息时,由于物体互相遮挡,机器人很可能无法观测到全部物体的信息,给规划带来了不确定性。
部分可观测马尔可夫决策过程(POMDP),是一种描述不确定性下决策过程的通用模型。POMDP规划是在不确定性下计算具有最大期望回报的动作。POMDP规划很难离线一次性计算出完整的策略,一般采用在线规划的方式,即每一步只规划机器人这一步需要执行的动作,执行动作并重新观测后,再规划下一步的动作。广泛使用的在线POMDP规划方法是信念树搜索,目前较先进的信念树搜索算法包括DESPOT和POMCP等。
尽管POMDP规划已成功应用在各行各业,但是应用在机器人物体拾放任务中仍然有不足之处。机器人物体拾放任务中并非每一步所有动作都是可行的,而过去的信念树搜索算法没有考虑这一点,在构建信念树时,每个结点下扩展的动作分枝通常来自整个动作空间。有时候会假设每一步有哪些动作可行是已知的,构建信念树时,每个结点下扩展的动作分枝来自可行的动作。但机器人物体拾放任务中每一步有哪些动作可行并非事先已知,一个拾取或放置物体的动作是否可行,取决于运动规划能否为这个动作找到可行的运动轨迹。
专利文献CN113190012A(申请号:202110506117.7)公开了一种机器人任务自主规划方法及系统。其中,该方法包括基于家庭环境语义知识模型,获得静态物品语义位置和静态物品与动态物品之间的位置关系;基于静态物品语义位置和静态物品与动态物品之间的位置关系,根据混合任务规划器来执行动作规划,直至机器人执行的任务序列完成任务;其中,混合任务规划器在执行动作规划的过程中,首先进行离线任务规划,并确定离线任务规划的动作影响是否为确定型来判断是否继续执行离线任务序列,当离线任务规划的动作影响为不确定型,然后再进行在线动作规划。专利文献CN112131754A(申请号:202011060344.3)公开了一种基于机器人伴随行为模型的扩展POMDP规划方法及系统,包括在标准POMDP规划过程中,当正在执行的任务动作aT的不变式与某一观察动作aO匹配时,将任务动作aT、观察动作aO基于匹配的谓词语句构成伴随关系形成伴随行为模型;在任务动作aT的执行过程中,获取观察动作aO的观察值obs;基于任务动作aT的不变式、观察值obs更新机器人的系统知识库kb;判断知识库kb中的不变式的真值为假是否成立,若成立则触发任务重规划。上述两个专利提供了基于POMDP的机器人任务规划算法,但是没有考虑动作的可行性
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于上海交通大学,未经上海交通大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202211729991.8/2.html,转载请声明来源钻瓜专利网。
- 上一篇:复合碳纤维芯钢丝绳
- 下一篇:基于智能头盔的骑行安全检测方法、装置及存储介质