[发明专利]一种基于增强学习的SDN数据中心拥塞控制方法有效

申请号：	201711081371.7	申请日：	2017-11-07
公开（公告）号：	CN107948083B	公开（公告）日：	2021-03-30
发明（设计）人：	金蓉;王伟明;李姣姣;庹鑫	申请（专利权）人：	浙江工商大学
主分类号：	H04L12/801	分类号：	H04L12/801;H04L12/825;H04L12/851
代理公司：	杭州求是专利事务所有限公司 33200	代理人：	傅朝栋;张法高
地址：	310018 浙江***	国省代码：	浙江;33
权利要求书：	查看更多	说明书：	查看更多
摘要：	本发明公开了一种基于增强学习的SDN数据中心拥塞控制方法。本发明方法基于SDN的网络背景，提出基于流的拥塞控制思想，引入增强学习中的Q‑learning算法，智能地全局分配流的速率，使网络的数据链路利用率尽可能高，同时又使整个网络避免拥塞，从而实现数据中心的拥塞控制。首先建模一个五元组对问题进行描述；然后提出改进的Q‑learning算法，对Q矩阵进行训练；最后根据流的请求，利用训练得到的Q矩阵，进行拥塞控制。本发明提供了一种控制效果较好，控制算法易实现，稳定性良好以及高效的自适应的SDN数据中心拥塞控制方法。本发明为SDN数据中心的拥塞控制问题提出了一种基于增强学习的智能解决方法。
搜索关键词：	一种基于增强学习 sdn 数据中心拥塞控制方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【主权项】：

一种基于增强学习的SDN数据中心拥塞控制方法，其特征在于，包含如下步骤：步骤1：将增强学习方法引入基于软件定义网络的数据中心，将基于SDN的数据中心拥塞控制问题描述成五元组<F,S,R,A,Q>；其中F表示待分配的流,其队列长度为N；S表示整个链路的状态，是长度为M的矢量；R表示选择action后获得奖励值的一个矩阵；A表示根据链路需求为flow分配速率的行为，是长度为N的矢量；Q表示经过训练得到的Q矩阵，用来表示智能体已经从经验中学到的知识；步骤2：基于改进的Q‑learning算法，对Q矩阵进行训练；具体包含如下步骤：2‑1.按照先验知识，给定奖励矩阵R，并将Q矩阵初始；2‑2.改进增强学习中的Q‑learning算法中选取action的方法，使算法结合当前状态以及当前flow所经过的路径两个条件，在R矩阵中选择最大奖励对应的action；2‑3.执行action，观察reward和新的链路状态，根据迭代更新Q值Q(S,a)；其中，Q(S,a)表示在当前状态S下执行动作a后的Q值，Q(S',a')表示下一状态S'下执行动作a'后的Q值，r是当前状态S下执行动作a后的奖励，γ为折扣因子，α为学习效率，是后续状态的折扣奖励，构成后续状态奖励的改善估计；2‑4.循环执行Q矩阵训练过程，直到s为最终状态，得到训练后的Q矩阵；步骤3：根据具体的flow请求，结合上述步骤2得到的经过训练得到的Q矩阵，进行拥塞控制。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于浙江工商大学，未经浙江工商大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/patent/201711081371.7/，转载请声明来源钻瓜专利网。

上一篇：以太网上的点对点协议的处理方法和系统以及代理装置
下一篇：一种限流方法和装置

同类专利

专利分类

H 电学

H04 电通信技术
H04L 数字信息的传输，例如电报通信
H04L12-00 数据交换网络
H04L12-02 .零部件
H04L12-28 .以通路配置为特征的，例如LAN[局域网]或WAN[广域网]
H04L12-50 .电路交换系统，即系统在通信期间通路具有完全永久性
H04L12-54 .存储转发交换系统
H04L12-64 .混合交换系统

免登录下载普通用户下载升级VIP会员，免费下载

[发明专利]一种基于增强学习的SDN数据中心拥塞控制方法有效

专利文献下载