[发明专利]基于强化学习的故障线路查找方法、装置、系统及介质有效
| 申请号: | 202111295995.5 | 申请日: | 2021-11-03 |
| 公开(公告)号: | CN113743681B | 公开(公告)日: | 2022-03-18 |
| 发明(设计)人: | 谢添阔 | 申请(专利权)人: | 广东电网有限责任公司惠州供电局;惠州市鸿业电力信息科技有限公司 |
| 主分类号: | G06Q10/04 | 分类号: | G06Q10/04;G06Q50/06;G01R31/08 |
| 代理公司: | 广东良马律师事务所 44395 | 代理人: | 张柯 |
| 地址: | 516000 广东*** | 国省代码: | 广东;44 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 强化 学习 故障 线路 查找 方法 装置 系统 介质 | ||
本发明公开了基于强化学习的故障线路查找方法、装置、系统及介质,通过采集配电网的线路信息并构建故障线路查找模型;初始化Q值表,Q值表用于记录在每个已核查线路下执行每个未核查线路的故障查验动作获得的折扣累计强化值;根据线路信息对各个未核查线路执行故障查验动作,根据查验结果和故障风险信息计算每次故障查验动作的立即强化值并更新Q值表,直到Q值表收敛;根据已收敛的Q值表和故障线路查找模型的输入线路状态输出故障查验动作的最优序列。通过在配电网的线路环境中不断探索各个线路并做出故障查验动作从而对Q值表进行迭代优化,使得在发生线路故障时能根据优化的Q值表快速准确的得到最优的故障查找序列,提高故障线路查找效率。
技术领域
本发明涉及配电网技术领域,尤其涉及基于强化学习的故障线路查找方法、装置、系统及介质。
背景技术
配电网是电力系统的终端环节,配电网任一设备的故障均会导致所在线路不可用,直接影响用户用电的可靠性。因此,在配电网发生故障时准确定位是尽快处理故障、恢复供电的前提条件。
由于配电网线路具有自愈率低、设备数量众多、运行方式多变、网络拓扑复杂等特点,使得在发生线路故障时难以在支路众多、结构复杂的配电网中及时找到故障线路,对用户的可靠用电带来不良影响。
因此,现有技术还有待于改进和发展。
发明内容
鉴于上述现有技术的不足,本发明的目的在于提供基于强化学习的故障线路查找方法、装置、系统及介质,旨在解决现有技术中配电网故障线路查找效率较低的问题。
本发明的技术方案如下:
一种基于强化学习的故障线路查找方法,包括:
采集配电网的线路信息并构建故障线路查找模型;
初始化Q值表,所述Q值表用于记录在每个已核查线路下执行每个未核查线路的故障查验动作获得的折扣累计强化值;
根据所述线路信息对各个未核查线路执行故障查验动作,根据查验结果和故障风险信息计算每次故障查验动作的立即强化值并更新所述Q值表,直到所述Q值表收敛;
根据已收敛的所述Q值表和所述故障线路查找模型的输入线路状态输出故障查验动作的最优序列。
在一个实施例中,所述根据所述线路信息对各个未核查线路执行故障查验动作,根据查验结果和故障风险信息计算每次故障查验动作的立即强化值并更新所述Q值表,直到所述Q值表收敛,包括:
随机选取一个线路作为初始线路状态;
在所述初始线路状态下根据所述线路信息选择下一个未核查线路执行所述故障查验动作,将所述下一个未核查线路作为当前线路状态;
根据所述下一个未核查线路的查验结果与故障风险信息计算本次故障查验动作的立即强化值,并根据所述立即强化值更新所述Q值表;
继续在所述当前线路状态下选择下一个未查验线路执行所述故障查验动作后更新所述Q值表,直到所述Q值表收敛。
在一个实施例中,所述根据所述下一个未核查线路的查验结果与故障风险信息计算本次故障查验动作的立即强化值,并根据所述立即强化值更新所述Q值表,包括:
确认所述下一个未核查线路是否查到故障;
若查到故障,则反馈预设奖励值作为本次故障查验动作的立即强化值;
若未查到故障,则根据所述下一个未核查线路的故障风险信息反馈相应的惩罚值,作为本次故障查验动作的立即强化值;
根据所述立即强化值更新所述Q值表。
在一个实施例中,所述根据所述下一个未核查线路的故障风险信息反馈相应的惩罚值,作为本次故障查验动作的立即强化值,包括:
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于广东电网有限责任公司惠州供电局;惠州市鸿业电力信息科技有限公司,未经广东电网有限责任公司惠州供电局;惠州市鸿业电力信息科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111295995.5/2.html,转载请声明来源钻瓜专利网。
- 同类专利
- 专利分类
G06Q 专门适用于行政、商业、金融、管理、监督或预测目的的数据处理系统或方法;其他类目不包含的专门适用于行政、商业、金融、管理、监督或预测目的的处理系统或方法
G06Q10-00 行政;管理
G06Q10-02 .预定,例如用于门票、服务或事件的
G06Q10-04 .预测或优化,例如线性规划、“旅行商问题”或“下料问题”
G06Q10-06 .资源、工作流、人员或项目管理,例如组织、规划、调度或分配时间、人员或机器资源;企业规划;组织模型
G06Q10-08 .物流,例如仓储、装货、配送或运输;存货或库存管理,例如订货、采购或平衡订单
G06Q10-10 .办公自动化,例如电子邮件或群件的计算机辅助管理





