[发明专利]基于知识嵌入的区域覆盖和连通保持的集群控制方法有效
| 申请号: | 202011393769.6 | 申请日: | 2020-12-03 |
| 公开(公告)号: | CN112203291B | 公开(公告)日: | 2021-02-23 |
| 发明(设计)人: | 丘腾海;吴士广;蒲志强;刘振;易建强;常红星 | 申请(专利权)人: | 中国科学院自动化研究所 |
| 主分类号: | H04W16/18 | 分类号: | H04W16/18;H04W16/22;G06N3/04;G06N3/08 |
| 代理公司: | 北京市恒有知识产权代理事务所(普通合伙) 11576 | 代理人: | 郭文浩;尹文会 |
| 地址: | 100190 *** | 国省代码: | 北京;11 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 知识 嵌入 区域 覆盖 连通 保持 集群 控制 方法 | ||
1.一种基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,该方法包括:
步骤S10,实时获取集群中各智能体和目标的状态信息,并通过全连接神经网络进行特征编码,获得智能体特征和目标特征;
步骤S20,计算所述智能体特征和目标特征之间的注意力关注系数, 归一化并通过观测多头注意力机制进行多头注意力特征提取,获得智能体与目标之间的观测注意力特征;
步骤S30,基于所述智能体与目标之间的观测注意力特征,通过通信多头注意力机制提取各邻居智能体的交互信息和查询目标特征、键目标特征和值目标特征映射、、,并通过多跳通信机制扩展智能体的感受野,获得智能体与目标之间的交互注意力特征;
步骤S40,分别基于代数连通度以及覆盖率和目标与智能体间的距离设计集群连通保持和集群对目标覆盖的总的奖惩函数,并结合所述交互注意力特征,计算当前时刻各智能体能够获得最大累计回报的动作;
步骤S50,将各智能体通过链式拓扑连接,并删除冗余重要连接边,获得目标覆盖大于设定阈值的通信拓扑图以及重要性节点集合;
步骤S60,基于分布式连通保持策略、重要性节点集合以及设定的约束条件之间的关系,计算各智能体保持连通的动作的最大步长;
步骤S70,基于所述最大步长进行动作的约束截断,并通过截断后的动作进行集群中各智能体控制。
2.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,步骤S20包括:
步骤S21,计算所述智能体特征和目标特征之间的注意力关系系数,并采用softmax函数进行归一化,获得不同目标的归一化关注系数;
步骤S22,基于所述不同目标的归一化关注系数、智能体特征,采用观测多头注意力机制进行多头注意力特征提取,获得智能体与目标之间的观测注意力特征。
3.根据权利要求2所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,所述不同目标的归一化关注系数,其公式表示为:
其中,为第
4.根据权利要求2所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,所述智能体与目标之间的观测注意力特征,其公式表示为:
其中,表示所述观测多头注意力机制的探测头个数,表示第个探测头,表示第个探测头的权重系数矩阵,为最优非线性函数,代表第个探测头对应的第
5.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,所述查询目标特征、键目标特征和值目标特征映射、、,其公式表示为:
其中,、和为设定的交互线性权重矩阵。
6.根据权利要求5所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,所述各邻居智能体的交互信息,其公式表示为:
其中,代表拼接操作,为最优非线性函数,
其中,代表键目标特征的维数。
7.根据权利要求1所述的基于知识嵌入的区域覆盖和连通保持的集群控制方法,其特征在于,所述智能体与目标之间的交互注意力特征,其公式表示为:
其中,为设定的权重系数矩阵,代表拼接操作。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202011393769.6/1.html,转载请声明来源钻瓜专利网。





