[发明专利]一种面向多智能体任务规划的复杂优化方法在审
申请号: | 202210401273.1 | 申请日: | 2022-04-18 |
公开(公告)号: | CN114819316A | 公开(公告)日: | 2022-07-29 |
发明(设计)人: | 江光德;陈豪;李冬雪;何浩东;魏国强;宫树香;马靖;杜林峰;刘庆国;伍樊成;魏庆栋;周颖;粱燕 | 申请(专利权)人: | 中国人民解放军96901部队 |
主分类号: | G06Q10/04 | 分类号: | G06Q10/04 |
代理公司: | 中国人民解放军火箭军专利服务中心 11040 | 代理人: | 李丽梅 |
地址: | 100094 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 面向 智能 任务 规划 复杂 优化 方法 | ||
本发明属于智能体任务规划优化技术领域,特别涉及一种面向多智能体任务规划的复杂优化方法。该方法基于马尔可夫决策和博弈论理论实现,包括多目标任务分配和多智能体路径规划;多目标任务分配采用双向竞标,即由智能体竞标目标任务和由目标任务竞标智能体的循环竞标策略;多智能体交互模块包括依次连接的相关性排序单元和循环交互单元;相关性排序单元用于进行相关性排序,循环交互单元采用循环递推结构对所述相关性排序单元输出的状态量进行降维,获得数据维度与智能体数量无关的交互信息。本发明能够在多对多任务规划的高维空间获得更优的局部最优解。
技术领域
本发明属于智能体任务规划优化技术领域,特别涉及一种面向多智能体任务规划的复杂优化方法。
背景技术
任务规划是智能体完成复杂工作的必要和关键环节。智能体的任务规划主要包括任务分配、路径规划、链路使用规划、传感器使用规划,以及任务规划的检验和评估等。
多智能体路径规划是多智能体的任务规划典型应用之一,也即无冲突地寻找多个智能体从起始位置到目标位置最优路径集合的一类问题。传统的路径规划算法例如人工势场法、D*法等,虽然一定程度上构建了机器人、智能体、无人车和无人船等路径规划解决方案,但这些传统算法多集中于在结构化或近似结构化的约束场景中解决单一目标或静态目标的简单任务规划,而真实场景中通常问题更为复杂,非结构化现场环境充满着各种不确定性,甚至需要多智能体协作才能完成预定任务,直接应用现有任务规划技术时极易发生解空间探索效率低下,对危险情况估计不足,甚至目标局部成功而整体规划失败等问题。
多智能体路径规划研究的重点集中在问题的求解方式、求解效率和求解质量上。任务规划问题的求解通常是依托优化问题来求解。最优的多智能体路径规划技术主流方法包括A*类搜索、代价增长树搜索和基于冲突的搜索三大类,这些方法借助精心设计优化算法,可以获得全局最优的多智能体路径规划,但通常以空间代价与时间代价高、求解速度慢,高层次搜索冗余度高、实现难度高为代价。
近年来,随着计算技术迅猛发展,多智能体路径规划逐步应用到高度复杂真实场景,原有许多优化问题相应呈现出非线性、不可微、规模大,NP难的特点,进而导致使用上述传统最优规划方法,在面对越来越复杂的问题时显现出其局限性和不足。特别是多智能体解空间随着状态量维度的增长而指数增长,最优的多智能体路径规划只在较少应用中具有实用价值。因此,适当牺牲多智能体路径规划算法的最优性能,换取大幅提高算法的执行效率成为解决工程实际问题可行替代方案。基于此思路代表技术由基于搜索和基于规则的近似的多智能体路径规划算法。这些方法都较易于实现,但难以兼顾求解速度快与结果质量,进而限制其在实际工程中的推广应用。
为了解决上述问题,如何在保持信息表示有效性的前提下,降低待优化问题的样本维度,是应对现实场景的多对多复杂任务规划问题的关键所在。
发明内容
为了解决现有技术中多对多复杂规划问题的样本空间维度高、优化求解速度慢等问题,本发明将多智能体任务规划分为目标任务分配和多智能体路径规划,采用智能体与目标任务双向竞标实现目标任务分配,采用多智能体循环交互单元构建智能体历史经验的共享与信息交互,在兼顾求解速度与结果质量的前提下,完成多智能体任务规划。
为了实现上述目的,本发明的技术方案为:
一种面向多智能体任务规划的复杂优化方法,所述多智能体任务规划基于马尔可夫决策和博弈论理论实现,包括多目标任务分配和多智能体路径规划;
所述多目标任务分配采用双向竞标,即由智能体竞标目标任务和由目标任务竞标智能体的循环竞标策略;
记所有智能体的状态量为全局状态量,所述多智能体路径规划是采用多智能体交互模块对所述全局状态量进行降维,降维后的状态量经动作决策,得到最优动作集合,即最优路径规划结果;其中,为第
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国人民解放军96901部队,未经中国人民解放军96901部队许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210401273.1/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理