[发明专利]基于分层模糊推理的遗传优化智能决策方法及装置在审
申请号: | 202210945288.4 | 申请日: | 2022-08-08 |
公开(公告)号: | CN115423100A | 公开(公告)日: | 2022-12-02 |
发明(设计)人: | 康扬名;吕品;邓石钢;张亚星 | 申请(专利权)人: | 中国科学院自动化研究所 |
主分类号: | G06N5/04 | 分类号: | G06N5/04;G06N7/02 |
代理公司: | 北京路浩知识产权代理有限公司 11002 | 代理人: | 王文君 |
地址: | 100190 *** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 分层 模糊 推理 遗传 优化 智能 决策 方法 装置 | ||
1.一种基于分层模糊推理的遗传优化智能决策方法,其特征在于,包括:
将网电对抗中影响决策输出的各状态变量、网电层决策的各输出变量以及物理层决策的各输出变量分别在其论域内进行模糊化,得到多个模糊集,并将所述多个模糊集进行数字符号编码,得到模糊推理的前件和后件,形成战术规则数据库;
在每一战斗回合中,重复执行以下步骤,直至满足一方获胜的条件或者达到一个战斗回合的最大步长:针对每个决策周期,确定当前决策周期的输入变量和每个所述输入变量的动态权重,根据所述战术规则数据库,按照网电域和物理域分层次模糊推理出网电域的动作决策和物理域的动作决策,并更新下一决策周期的输入变量;
基于全局对抗回报函数计算当前战斗回合的战局情况对应的全局对抗回报值,并基于所述全局对抗回报值进行遗传优化算法的战术优化,更新所述战术规则数据库,所述全局对抗回报函数用于按照分层评价的方式计算不同战局情况的全局对抗回报值。
2.根据权利要求1所述的基于分层模糊推理的遗传优化智能决策方法,其特征在于,所述网电对抗中影响决策输出的各状态变量包括:智能体与障碍物和目标的相对距离、智能体与目标的视线角以及目标组件的状态;所述网电对抗中网电层决策的各输出变量包括:雷达功率变量和雷达频率变量;所述网电对抗中物理层决策的各输出变量包括:智能体的期望位置变量和智能体的偏航角变量。
3.根据权利要求1所述的基于分层模糊推理的遗传优化智能决策方法,其特征在于,所述确定当前决策周期的输入变量,包括:
获取群体中各智能体、各目标以及各障碍物的状态信息;其中,所述群体中各智能体包括:至少一个第一智能体和至少一个第二智能体,所述各目标包括:至少一个第一目标和至少一个第二目标;
基于所述第一智能体的状态信息与每个所述障碍物的状态信息分别计算所述第一智能体与每个所述障碍物之间的距离;
在所述第一智能体与至少一个所述障碍物之间的距离小于安全距离的情况下,计算所述第一智能体与所述第一目标之间的引力以及所述第一智能体与所述障碍物之间的斥力;
基于所述引力和所述斥力控制所述第一智能体进行避障,并确定所述第一智能体避障后的期望位置;
计算所述第二目标的信干比,所述第二目标的信干比用于确定所述第一智能体与所述第二目标的通信链路是否被干扰;
将所述第一智能体的状态信息、所述第一目标的状态信息、所述第二目标的状态信息、所述第二目标的信干比以及第一智能体避障后的期望位置,确定为当前决策周期的输入变量。
4.根据权利要求3所述的基于分层模糊推理的遗传优化智能决策方法,其特征在于,所述根据所述战术规则数据库,按照网电域和物理域分层次模糊推理出网电域的动作决策和物理域的动作决策,并更新下一决策周期的输入变量,包括:
基于所述当前决策周期的输入变量和每个所述输入变量的动态权重,根据所述战术规则数据库模糊推理出网电域的动作决策;
控制所述第一智能体执行所述网电域的动作决策,并评估执行效果;
基于所述当前决策周期的输入变量和每个所述输入变量的动态权重,根据所述执行效果和所述战术规则数据库模糊推理出物理域的动作决策;
将所述物理域的动作决策和所述第一智能体避障后的期望位置进行融合,得到下一决策周期的期望位置;
基于所述下一决策周期的期望位置更新下一决策周期的输入变量。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于中国科学院自动化研究所,未经中国科学院自动化研究所许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202210945288.4/1.html,转载请声明来源钻瓜专利网。
- 上一篇:一种展览展示视觉呈现设备
- 下一篇:驻车加热器系统及其控制方法