[发明专利]一种基于Q学习和LSTM神经网络的快速路由决策方法有效
申请号: | 201810480062.5 | 申请日: | 2018-05-18 |
公开(公告)号: | CN108667734B | 公开(公告)日: | 2020-12-08 |
发明(设计)人: | 朱晓荣;陈必康;王树同;韩嗣诚 | 申请(专利权)人: | 南京邮电大学 |
主分类号: | H04L12/751 | 分类号: | H04L12/751;H04L12/725 |
代理公司: | 南京瑞弘专利商标事务所(普通合伙) 32249 | 代理人: | 杨晓玲 |
地址: | 210003 江苏*** | 国省代码: | 江苏;32 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开了一种基于Q学习和LSTM神经网络的快速路由决策算法,该算法主要分为模型训练和动态路由决策两个阶段;模型训练阶段主要是利用启发式算法根据不同的QoS请求计算出满足约束条件的最优或者较优路径。之后将该启发式算法的输入和其相应的输出联合构成机器学习模型的训练集,并以此作为不同路由的目标Q值来对决策模型进行训练。在此基础上,当控制器收到新的QoS请求时,相应的机器学习模型将会把当前的网络状态和请求中的约束条件一同作为模型的输入,通过LSTM和Q学习相结合的路由决策模型快速计算出相应的Q值,完成预测并输出最优路径。该过程所需的时间比起启发式算法的来说将大大缩短,而结果却十分相似。 | ||
搜索关键词: | 一种 基于 学习 lstm 神经网络 快速 路由 决策 方法 | ||
【主权项】:
1.一种基于Q学习和LSTM神经网络的快速路由决策算法,其特征是,包括如下步骤:1)建立模型并进行训练:在不同的网络状态下,利用启发式算法根据不同的QoS请求计算出满足约束条件的最优或者较优路径;将该启发式算法的输入和其相应的输出联合构成机器学习模型的训练集,其中启发式算法输入的当前网络状态作为训练样本的特征,算法输出的最优路径相应的Q值作为训练样本的标签;将其网络状态和业务需求作为输入,最优路由作为输出,存入网络路由知识库;2)动态路由决策:当控制器收到新的QoS请求时,相应的机器学习模型将会把当前的网络状态和请求中的约束条件一同输入LSTM神经网络中,并根据相应的决策流程得到该状态下不同动作a即转发路由所对应的Q值;选择Q值最大所对应的路由即最佳路由进行转发。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于南京邮电大学,未经南京邮电大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201810480062.5/,转载请声明来源钻瓜专利网。
- 上一篇:一种网络设备及报文处理方法
- 下一篇:一种组播数据的转发方法和装置