[发明专利]一种包含互斥资源的多智能体系统的控制器生成方法有效

申请号：	202110757211.X	申请日：	2021-07-05
公开（公告）号：	CN113420864B	公开（公告）日：	2022-06-14
发明（设计）人：	张慧敏;施薏	申请（专利权）人：	广西师范大学
主分类号：	G06N3/00	分类号：	G06N3/00
代理公司：	桂林市华杰专利商标事务所有限责任公司 45112	代理人：	陆梦云
地址：	541004 广西壮***	国省代码：	广西;45
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种包含资源智能体系控制器生成方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种包含互斥资源的多智能体系统的控制器生成方法，包括如下步骤：

1)定义模型：所述多智能体系统由n个具有传感、计算、执行能力的单个智能体组成，第i个智能体用A_i＝(Q_i，∑_i，δ_i，q_i，0，Q_i，m)表示，其中i∈N_n＝{1，…，n}，对于任意智能体A_i和A_j，i，j∈N_n且i≠j，字母表令r_i表示第i个互斥资源，其中i∈N_m＝{1，…，m}，如果资源r_k被两个不同的智能体A_i和A_j互斥共享，那么A_i和A_j不能同时使用资源r_k，对r_k的约束可以用一个有限状态自动机R_k进行描述，其它控制需求由自动机H描述，利用监督控制理论可以得到整个系统关于控制需求R₁，...，R_m及H的全局控制器S，在TCT软件中采用如下过程进行计算：

1-1)计算A＝sync{A₁，…，A_n)；

2-1)计算H′＝sync{R₁，…，R_m，H)；

3-1)计算S＝supcon(A，H)；

在步骤1-1)中，受控系统A的规模随着智能体的数量n呈指数增长；在步骤2-1)中，描述全局控制需求的有限状态自动机H的规模也随着子需求m的数量呈指数增长;在步骤3-1)中，生成受控系统关于所有控制需求的全局控制器，用有限状态自动机S表示；

2)依据智能体使用互斥资源的不同情况，分别按照以下四种场景进行处理：

1-2)场景1为两个智能体使用一个互斥资源：令A₁＝(Q₁，∑₁，δ₁，q_1，0，Q_1，m)和A₂＝(Q₂，∑₂，δ₂，q_2，0，Q_2，m)分别表示两个智能体，且设r为A₁和A₂使用的互斥资源，H是描述除去r之外的其它所有控制需求的有限状态自动机，字母表和分别表示智能体A₁和A₂开始使用资源r的事件集，字母表和分别表示智能体A₁和A₂释放资源r的事件集，在场景1下生成控制器的过程如下：

1-1-2)建立描述资源r互斥性控制需求的确定有限状态自动机R＝(Q，∑，δ，q₀，Q_m)，其中Q＝{0，1，2}，q₀＝0，Q_m＝{0，1，2}；

2-1-2)令q₁∈Q₁且q₂∈Q₂，对于如果δ₁(q_1，0，σ₁)！，δ₂(q_2，0，σ₂)！且δ₁(q_1，0，σ₁)＝q′₁，δ₂(q_2，0，σ₂)＝q′₂，那么(q₁，q₂)是A₁和A₂关于R的一个互斥状态对，依据算法2计算A₁＝(Q₁，∑₁，δ₁，q_1，0，Q_1，m)和A₂＝(Q₂，∑₂，δ₂，q_2，0，Q_2，m)关于R的所有互斥状态对：

算法2：计算A₁和A₂关于R的互斥状态对：

输入：A₁，A₂，R；

输出：智能体A₁和A₂关于R的所有互斥状态对，具体为：

1)令

2)令

3)while(q₁∈Q₁)；

5)if(δ₁(q₁，σ₁)！且δ₁(q₁，σ₁)＝q′₁)；

7)end if；

8)end while；

9)end while；

10)while(q₂∈Q₂)；

11)

12)if(δ₂(q₂，σ₂)！且δ₂(q₂，σ₂)＝q′₂)；

13)

14)end if；

15)end while；

16)end while；

17)且

3-1-2)A＝mutex(A₁，A₂，list)；

4-1-2)S＝supcon(A，H)，

步骤4-1-2)得到的控制器S和S′＝supcon(A₁||A₂，R||H)是同构的；

2-2)场景2为两个智能体使用多个互斥资源：设r₁，r₂，…，r_n为智能体A₁＝(Q₁，∑₁，δ₁，q_1，0，Q_1，m)和A₂＝(Q₂，∑₂，δ₂，q_2，0，Q_2，m)互斥共享的资源，事件集和中的事件分别表示智能体A₁开始占用和释放资源r_i，事件集和中的事件分别表示智能体A₂开始占用和释放资源r_i，令在场景2下生成控制器的过程如下：

1-2-2)建立描述资源r_i互斥性控制需求的有限状态自动机R_i：自动机用R_i(i∈{1，2，…，n})＝(Q_i，∑_i，δ_i，q_i，0，Q_i，m)表示，其中Q_i＝{0，1，2}，q_i，0＝0，Q_i，m＝{0，1，2}；

2-2-2)A₁和A₂关于多个资源r₁，r₂，…，r_n的控制需求R₁，R₂，...，R_n的互斥状态对采用以下流程计算：

(1)利用算法2在R₁上得到list₁；

(2)利用算法2在R₂上得到list₂；

……

(n)利用算法2在R_n上得到list_n；

互斥状态对list＝list₁∪list₂∪…∪list_n；

其中，list_i表示A₁和A₂关于R_i的互斥状态对集合，利用算法2得到list_i，A₁和A₂关于所有资源的互斥状态list＝list₁∪…∪list_n；

3-2-2)计算系统关于所有控制需求的控制器：

设R＝R₁||R₂||…||R_n，假设除了R外，其它控制需求由自动机H来表示，计算控制器的步骤如下：

(1)A＝mutex(A₁，A₂，list)；

(2)S＝supcon(A，H)，令K＝L_m((A₁||A₂)∩(R||H))，在场景2下，supC(L_m(A)∩L(H)，L(A))＝supC(K，L(A₁||A₂))；

3-2)场景3为多个智能体使用一个互斥资源：设A_i＝(Q_i，∑_i，δ_i，q_i，0，Q_i，m)为第i个智能体，其中i∈R_n且n＞2，对于任意两个智能体A_i和A_j，且i≠j，设r为所有智能体使用的互斥资源，事件集和中的事件分别表示智能体A_i开始占用和释放资源r，令且∑′＝∑₁∪...∪∑_n-∑^O-∑^R，在场景3下生成控制器的过程如下：

1-3-2)建立描述资源r互斥性控制需求的有限状态自动机RR＝(Q，∑，δ，q₀，Q_m)，其中Q＝{0，1，2，…，n}，q₀＝0，Q_m＝{0，1，2，…，n}；

2-3-2)依据算法3计算A₁，…，A_n-1和A_n关于RR的所有互斥状态对：

算法3：计算n个智能体共享一个互斥资源RR时的互斥状态对：

输入：A₁，…，A_n，RR，…，

输出：n个智能体关于RR的所有互斥状态对，具体为：

1)i＝1；

2)while(i≤n)；

4)while(q_i∈Q_i)；

6)if(δ_i(q_i，σ_i)！且δ_i(q_i，σ_i)＝q′_i)；

8)end if；

9)end while；

10)end while；

11)i++；

12)end while；

13)j＝1；

14)while(j≤n)；

15)k＝j+1：

16)while(k≤n)；

17)while(q_i∈Q_i)；

18)while(q_k∈Q_k)；

19)list＝list∪{(q_i，q_k)}；

20)end while；

21)end while；

22)k++；

23)end while

24)i++；

25)endwhile；

26)输出list；

其中的步骤2)到步骤12)为计算智能体A_i使用资源r时所处的状态，步骤13)到步骤25)计算各智能体的互斥状态对，设n_q＝max(|Q₁|，…，|Q_n|)且n_e＝max(|∑₁|，…，|∑_n|)，算法3的计算复杂度为O(max(n.n_q.n_e，n².n_q))；

3-3-2)生成受控系统A₁||…||A_n关于总体控制需求的全局控制器：依据算法4计算n个(n＞2)智能体共享一个资源的情况，算法4计算n个智能体使用一个互斥资源的“mutex”函数：

输入：不相交的智能体A₁，A₂，…，A_n和互斥状态对集合list；

输出：关于A₁||A₂||...||A_n和约束列表list的控制器，具体为：

1)执行A_12…n＝A₁||A₂||…||A_n；

2)在A_12…n中删除列表list中的状态，以及A_12…n中沿不可控路径可到达list中状态的所有状态；

3)A_12…n＝AC(A_12…n)；

4)输出A_12…n；

输出结果A_12…n是可达的且可控的，设A＝A₁||…||A_n，如果A_12…n是可到达的，算法4恰好是计算受控系统A关于控制需求RR的控制器；否则，采用S＝supcon(A，A_12…n)得到控制器，假设除RR之外的其它控制需求由自动机H来表示，受控系统关于全局控制需求的控制器按如下步骤生成：

(1)A＝mutex(A₁，…，A_n，list)；

(2)S＝supcon(A_12…n，H)，设K＝L_m(A||(R||H))，则supC(L_m(A_12…n)∩L(H)，L(A_12…n))＝supC(K，L(A))；

4-2)场景4为多个智能体共享多个资源：设A₁，A₂，…，A_n为n个智能体，r₁，r₂，…，r_m为m个资源，令集合A＝{A₁，…，A_n}，集合r＝{r₁，…，r_m}，资源分配函数定义为映射Φ：r→2^A，Φ(r_i)＝A_i，其中r_i∈r，场景4中的问题可以分解为m个“多个智能体共享一个资源”子问题，A_i中的智能体关于资源r_i的互斥状态对采用算法4计算，智能体-资源关系图ARRD的定义：

智能体资源关系图ARRD(A，r，Φ)是一个无向图，其中，A是一组互不相交的智能体，r是一组由集合A中的智能体共享的互斥资源，Φ：r→2^A是资源分配函数，Φ(r_i)＝A_i表示互斥资源r_i由A_i中的智能体共享，在ARRD的图形表示中，用矩形表示智能体，矩形下面的括号中给出了描述该智能体的有限状态自动机的状态数和转移数，用椭圆形表示资源，如果Φ(r_i)＝A_i，则从r_i到A_i中的每个智能体都画一条直线，在这个场景中，问题被分解成m个场景3的子问题，采用两种贪婪思想解决子问题处理的优先级问题：

贪婪思想1：mutex函数中删除的状态越多，最后得到的自动机规模就越小；

贪婪思想2：各智能体并行组合后的规模尽可能小，智能体的规模越小，涉及这些智能体的控制需求就越优先处理，对于关于互斥资源r_i的控制需求用自动机R_i进行描述；

基于ARRD和上述两种贪婪思想，生成关于智能体和互斥资源控制需求的控制器的算法如算法5所示：

算法5：关于n个智能体和m个互斥资源的控制器计算方法：

输入：ARRD(A，r，Φ)，n个智能体A₁，A₂，…，A_n和m个描述互斥资源的自动机R₁，R₂，…，R_m；

输出：关于智能体和互斥资源控制需求的控制器，具体为：

1)i＝1；R＝{R₁，R₂，…，R_m}；

2)while(i≤|R|)；

4)通过算法2计算list_i；

5)j＝i+1；

6)while(j≤|R|)；

7)if(Φ(r_i)＝Φ(r_j))；

8)通过算法4计算list_j；

9)list＝list∪list_j；

10)R＝R-{R_j}；

11)end if；

12)j++；

13)end while；

14)

15)list＝list∪list_i；

16)A_i＝Φ(r_i)；

17)A′_i＝mutex(A_i，list)；

18)A＝A-A_i；

19)A＝A∪{A_i}′；

20)end if；

21)i++；

22)end while；

23)k＝1，p＝0；

24)l_min＝+∞；

25)

26)for each R_k∈R；

27)

28)if(l_min＞l)；

29)l_min＝l；

30)p＝k；

31)endif；

32)end while；

33)计算list_p；

34)A′_p＝muter(A_p，list_p)；

35)A＝A-A_p；

36)A＝A∪{A′_p}；

37)R＝R-{R_p}；

38)end while；

39)输出A′_p；

其中，步骤2)到步骤22)描述了多个互斥资源被同一智能体共享，采用第一种贪心思想处理关于这些资源控制需求的优先级；从步骤23)到步骤38)，按照第二种贪心思想处理相关控制需求的优先级，算法5的计算复杂度为O(|R|²)，算法5的输出用S_r表示，假设其它控制需求由自动机H描述，设A＝A₁||…||A_n，受控系统关于全局控制需求的控制器由下式计算：

S＝supcon(S_r，H)，

设K＝L_m(A)∩L(R||H)，SupC(L_m(S_r)∩L(H)，L(Sr))＝SupC(K，L(A))。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广西师范大学，未经广西师范大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202110757211.X/1.html，转载请声明来源钻瓜专利网。

同类专利

专利分类

G 物理

G06 计算；推算；计数
G06N 基于特定计算模型的计算机系统
G06N3-00 基于生物学模型的计算机系统
G06N3-02 .采用神经网络模型
G06N3-12 .采用遗传模型
G06N3-04 ..体系结构，例如，互连拓扑
G06N3-06 ..物理实现，即神经网络、神经元或神经元部分的硬件实现
G06N3-08 ..学习方法

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种包含互斥资源的多智能体系统的控制器生成方法有效

专利文献下载