[发明专利]一种多智能体高阶信念认知规划器实现方法在审
申请号: | 201611139540.3 | 申请日: | 2016-12-12 |
公开(公告)号: | CN106779046A | 公开(公告)日: | 2017-05-31 |
发明(设计)人: | 黄晓;刘咏梅 | 申请(专利权)人: | 中山大学 |
主分类号: | G06N3/00 | 分类号: | G06N3/00 |
代理公司: | 广州粤高专利商标代理有限公司44102 | 代理人: | 林丽明 |
地址: | 510275 广东*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 智能 体高阶 信念 认知 规划 实现 方法 | ||
技术领域
本发明涉及计算理论下人工智能的自动化规划领域,更具体地,涉及一种多智能体高阶信念认知规划器实现方法。
背景技术
自动化规划是人工智能领域中的一个极其重要的分支。其主要目的在于描述实际应用场景中的实体与动作,并自动生成能够达到某一目标的动作树或者动作序列。而要实现这个目标,我们需要通过形式化方法来表示实体的知识库、动作的前提与效果、目标等。在此基础上,我们可以尝试对此进行实验,实现正确的、能够处理一系列规划实例的应用规划器,从而自动生成可行正确的规划方案,来解决各种规划问题。
就自动化规划领域而言,经典规划是目前各种主流研究工作的重要基础。经典规划可以凭借其以下特点对其他类型的规划加以区分,即其状态变迁系统是可完全观察的、确定性的、有限的、与静态的,而且也往往伴随着受限的目标。
然而,随着自动化规划理论体系的不断巩固与拓展,人们发现许多现实生活中的实际情景无法得到很好的表达, 许多规划问题实例也无法以传统的经典规划方法得到解决。相对于传统不带认知模态算子的规划,拥有自身知识库与信念的智能体能够拥有更加强大的表达能力;相对于传统的单智能体规划,有许多设计涉及智能体间互动的规划问题仅仅在多智能体设定下能得到解决方案;相对于过去可完全观察的、确定性的,静态的环境,如今存在大量部分可观察的、随机的、动态的规划问题当且仅当在多智能体认知规划的理论体系下才能得到解决。
由此可见,多智能体认知规划是目前规划领域中一个重要的问题。与传统的经典规划不同,当一个规划问题里存在多个智能体时,我们不仅仅要处理某一个智能体个体所拥有的知识与信念的推理,而且要面临智能体对相互之间的信念的推理问题以及智能体群体的公共知识问题。这往往导致了一个寻求可行规划算法搜索空间的急剧膨胀。除此之外,引入智能体间互动后,要给出智能体如何做知识更新与演进的自然的、可行的语义定义,会显得十分困难。在此情况下,寻求出一种对多智能体认知规划的、拥有良好性质的形式化定义,在目前自动化规划领域有着非常重要的意义。
传统的自动化规划不仅在学术上有着重大的意义,而且在工业界更是有广泛的应用,例如救援仿真机器人系统,以及实现日常生活当中的消防、医疗、警卫智能体等等。因此,多智能体认知规划无论是在学术上与工业界都有更加深远的意义与光明的前景。在理论上,它能给出拥有更强表达能力的规划语言,拓展规划领域中能够建模的问题范围。而在实际应用上,它能指导仿真机器人群体互动等的技术实现,促进机器人完成更加复杂的语言与行为。
对多智能体认知规划进行研究,将推动多智能体规划在现实和研究中的应用,丰富多智能体规划的理论基础,为其他类型更为复杂的规划问题提供解决问题的新思路。
发明内容
本发明为克服上述现有技术所述的至少一种缺陷,提供一种多智能体高阶信念认知规划器实现方法。
为解决上述技术问题,本发明的技术方案如下:
一种多智能体高阶信念认知规划器实现方法,包括以下步骤:
S1:输入epddl文件,通过语言编译器将epddl文件转化为带K模动态词的公式树,所述epddl文件是对多智能体认知规划问题的智能体个数、动作的前提与效果,初始知识库与目标进行描述的集成文件;
S2:将公式树转化为CDF(Cover Disjunctive Formula)范式,CDF范式表示一个知识库;
S3:将得到的CDF范式作为初始知识库输入到PrAO规划算法,所述PrAO规划算法为多智能体高阶信念认知规划器求解算法;
S4:PrAO规划算法通过用链表这种数据结构进行建图并生成解。
在一种优选的方案中,步骤S1-S2中,使用lex+yacc将epddl文件转化为带K模动态词的公式树,其中lex为生成扫描器工具,yacc为语法分析器工具,两者均为开源资源,操作系统为Linux或者Mac。
在一种优选的方案中,步骤S1-S2中,将epddl语言描述的初始知识库、动作的前提与效果、目标取下来用C++中特定的数据结构存放,然后用一个类去实现CDF范式,最终再将原来的数据结构用CDF范式的类去表示
在一种优选的方案中,步骤S4中,具体包括以下步骤:
S4.1:判断初始知识库是否蕴含目标,若否,则构造根节点并跳转到步骤S4.2,若是,则返回空;
S4.2:判断所有可达节点是否已探索过,若否,则选取一个为探索的可达节点并跳转到步骤S4.3,若是,则返回空;
S4.3:计算可执行动作的集合S;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中山大学,未经中山大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201611139540.3/2.html,转载请声明来源钻瓜专利网。