[发明专利]一种基于强化学习的网络流量负载均衡控制方法无效

申请号：	201110447514.8	申请日：	2011-12-27
公开（公告）号：	CN102571570A	公开（公告）日：	2012-07-11
发明（设计）人：	胡朝辉;梁智强;梁志宏;周强峰;江泽鑫;石炜君;梁毅成	申请（专利权）人：	广东电网公司电力科学研究院
主分类号：	H04L12/56	分类号：	H04L12/56
代理公司：	广州知友专利商标代理有限公司 44104	代理人：	周克佑
地址：	510080 广东省广***	国省代码：	广东;44
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于强化学习的网络流量负载均衡控制方法，包括以下步骤：1)数据包处在路由器节点R*时，根据当前数据包的状态量s和策略π从下一跳的动作集合选择回报值最大的动作ai；2)当前数据包被路由以后，根据该数据包的实际情况修改该数据包的状态量s；并更新当前数据包的下一跳的动作集合；3)根据当前网络流量均衡状态修改当前数据包的奖惩值r；4)根据奖惩值更新策略π；重复步骤1)到步骤4)，直到当前数据包达到最终目的地址。该方法通过智能体与网络环境不断的交互学习，实现网络流量负载均衡的最优或近似最优控制。
搜索关键词：	一种基于强化学习网络流量负载均衡控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于强化学习的网络流量负载均衡控制方法，其特征在于包括以下步骤：1)、数据包处在路由器节点R*时，根据当前数据包的状态量s和策略π从下一跳的动作集合选择回报值最大的动作ai，并将数据包发送到动作ai对应的路由器；2)、当前数据包被路由以后，根据该数据包的实际情况修改该数据包的状态量s；并更新当前数据包的下一跳的动作集合；所述状态量s包括路由距离xi和流量均衡量yi；所述路由距离xi是指：选择链路i后，下一跳地址距离目的地址的最短矢量距离；流量均衡量yi是指：链路i上的当前流量占链路饱和流量的比例；3)、根据数据包的路由距离、流量均衡量给与数据包的奖惩值r；4)、数据包根据奖惩值r更新自身的策略π；5)、回到步骤1)，重复步骤1)到步骤4)，直到当前数据包达到最终目的地址。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于广东电网公司电力科学研究院，未经广东电网公司电力科学研究院许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201110447514.8/，转载请声明来源钻瓜专利网。

上一篇：一种具有缓解体力疲劳作用的营养膳及其制备方法
下一篇：无线移动网络中的设备识别、缓存控制以及增强型CDN通信

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L12-00 数据交换网络
H04L12-02 .零部件
H04L12-28 .以通路配置为特征的，例如LAN[局域网]或WAN[广域网]
H04L12-50 .电路交换系统，即系统在通信期间通路具有完全永久性
H04L12-54 .存储转发交换系统
H04L12-64 .混合交换系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于强化学习的网络流量负载均衡控制方法无效

专利文献下载