[发明专利]一种应用于救援环境的多机器人任务搜索方法在审
申请号: | 202310530144.7 | 申请日: | 2023-05-11 |
公开(公告)号: | CN116661430A | 公开(公告)日: | 2023-08-29 |
发明(设计)人: | 彭志红;尚沛桥;陈杰;李利华;何辉 | 申请(专利权)人: | 北京理工大学 |
主分类号: | G05D1/00 | 分类号: | G05D1/00 |
代理公司: | 北京理工大学专利中心 11120 | 代理人: | 高会允 |
地址: | 100081 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 应用于 救援 环境 机器人 任务 搜索 方法 | ||
1.一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述机器人硬件组成包括激光雷达,机器人车载机,以及移动机器人本体;所述方法包括如下步骤:
第一步:离散化救援环境,根据救援环境和参与搜索的机器人信息,构建面向对象的多机部分可观测马尔科夫决策模型来描述任务搜索问题;
第二步:每个机器人对自己当前状态进行判断自己是否受困,若机器人受困,则首先根据自适应方法确定阈值,然后对信念值在自适应区间的点进行聚类,进而采用A*方法进行引导决策,确定当前执行动作;若机器人没有受困,则选择奖励最高动作作为当前执行动作;
第三步:每个机器人按照当前执行动作执行,获得环境观测和奖励值,机器人根据原始信念和观测分别更新每个对象的信念;
第四步:根据最大最小方法同步所有机器人的信念,确定每个对象在每个位置上最可能的状态,指导机器人下一时刻的自主决策;
重复第二步到第四步,直到环境内所有的任务被搜索到。
2.根据权利要求1所述的一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述由救援环境和参与搜索的机器人信息,构建面向对象的多机部分可观测马尔科夫决策模型来描述任务搜索问题,具体为:
将整个救援环境离散化为L×L个栅格,L为环境规模,按照实际状况定义;
救援环境和参与搜索的机器人信息包括:先验环境信息、状态动作带有传感器噪声的观测状态转移模型以及奖励函数构建五元组
其中状态由每个机器人和每个任务的状态组成;
动作由{向四个方向的移动,观测,查找}的集合组成;其中向四个方向移动的动作步长均为1个栅格。
带有传感器噪声的观测由基于事件的带有误差(∈,σ)的高斯模型定义;∈,σ分别为高斯模型的期望和方差;
状态转移模型以及奖励函数按照实际状况定义;
由此获得描述任务搜索问题的面向对象的多机部分可观测马尔科夫决策模型。
3.根据权利要求1或2所述的一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述每个机器人对自己当前状态进行判断自己是否受困,具体地,每个机器人根据模拟构建蒙特卡罗树,机器人判断蒙特卡罗树所有的奖励都小于零,则机器人受困,则判断机器人受困,否则判断机器人没有受困。
4.根据权利要求1或2所述的一种应用于救援环境的多机器人任务搜索方法,其特征在于,所述若机器人受困,则首先根据自适应方法确定阈值,然后对信念值在自适应区间的点进行聚类,进而采用A*方法进行引导决策,确定当前执行动作,具体为:
首先通过以下关系确定自适应阈值的左边界:
其中TL为左边界,Nf为找到的任务数量,N为全部任务数量,Bj为编号为j的机器人信念的最大值,P是所有位置集合,O为所有任务集合,L为环境规模,右边界设置为设定数值;
然后机器人将信念值在自适应区间的所有位置聚为m类,机器人选取离自己最近的点作为引导点,利用A*算法规划路径并以规划的第一个动作作为自己的当前执行动作。
反之则利用蒙特卡罗树中奖励最大的动作作为自己的行为。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京理工大学,未经北京理工大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202310530144.7/1.html,转载请声明来源钻瓜专利网。