[发明专利]一种基于改进强化学习的复杂网络局部破坏的自改进恢复策略在审
申请号: | 201810375758.1 | 申请日: | 2018-04-25 |
公开(公告)号: | CN108573303A | 公开(公告)日: | 2018-09-25 |
发明(设计)人: | 冯强;吴其隆;任羿;孙博;杨德真 | 申请(专利权)人: | 北京航空航天大学 |
主分类号: | G06N3/04 | 分类号: | G06N3/04;G06N3/08 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 100191*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于改进强化学习的复杂网络局部破坏的自改进恢复策略方法,解决了复杂网络进行集群维修的恢复策略生成的问题。步骤如下:1根据局部破坏信息建立复杂网络的集群维修状态矩阵。2基于初始集群维修状态生成复杂网络邻接矩阵。3基于神经网络模型预测集群的先验维修状态转移概率和维修策略价值。4基于蒙特卡洛树搜索算法遍历集群的维修策略解空间,并选择当前时刻全局最佳维修动作。5基于集群维修状态的变化更新复杂网络邻接矩阵。6基于集群维修状态和邻接矩阵计算并检验复杂网络的恢复程度。7基于强化学习经验参数训练神经网络参数。8基于恢复策略自改进过程的一系列最佳维修动作生成一个完整的维修恢复方案。 | ||
搜索关键词: | 复杂网络 集群 维修状态 恢复策略 局部破坏 邻接矩阵 强化学习 维修 改进 维修策略 神经网络模型预测 训练神经网络 矩阵 树搜索算法 动作生成 经验参数 信息建立 转移概率 先验 遍历 恢复 更新 检验 全局 | ||
【主权项】:
1.基于改进强化学习的复杂网络局部破坏的自改进恢复策略方法,其特征在于:它包含以下步骤:第一步:基于局部破坏建立复杂网络的集群维修状态矩阵:根据破坏信息建立复杂网络“节点‑单元”集群的维修状态0‑1矩阵。第二步:基于初始集群维修状态生成复杂网络邻接矩阵:考虑维修状态矩阵与邻接矩阵的映射关系,基于初始的集群维修状态生成复杂网络邻接矩阵。第三步:基于神经网络模型预测集群的先验维修状态转移概率:设计一个SE‑ResNet神经网络预测“节点‑单元”集群的先验维修状态转移概率和先验维修策略价值。第四步:基于蒙特卡洛树搜索算法遍历集群的维修策略解空间:遍历维修策略解空间,得到改进的维修状态转移概率矩阵,并据此选择当前时刻全局最佳维修动作。第五步:基于集群维修状态的变化更新复杂网络邻接矩阵。第六步:计算并检验复杂网络的恢复程度:基于复杂网络的集群维修状态和邻接矩阵计算并检验其恢复程度。第七步:基于强化学习经验参数训练神经网络参数:基于恢复策略自改进过程产生的一组最新的强化学习经验参数,利用梯度下降法训练神经网络参数。第八步:基于恢复策略自改进过程生成一个完整的维修恢复方案:由恢复策略自改进过程存储的一系列最佳维修动作生成一个完整的维修恢复方案。通过以上步骤,给出了一种基于改进强化学习的自改进恢复策略方法,可以解决复杂网络局部破坏状态下进行集群维修的恢复策略问题。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于北京航空航天大学,未经北京航空航天大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810375758.1/,转载请声明来源钻瓜专利网。