[发明专利]一种基于深度强化学习的分级存储数据自适应迁移方法有效

申请号：	202010785961.3	申请日：	2020-08-07
公开（公告）号：	CN112051969B	公开（公告）日：	2021-10-08
发明（设计）人：	张岩峰;付国;张一奇	申请（专利权）人：	东北大学
主分类号：	G06F3/06	分类号：	G06F3/06;G06N3/08
代理公司：	大连理工大学专利中心 21200	代理人：	戴风友;梅洪玉
地址：	110819 辽宁***	国省代码：	辽宁;21
权利要求书：	查看更多	说明书：	查看更多
摘要：
搜索关键词：	一种基于深度强化学习分级存储数据自适应迁移方法
钻瓜网技术展会专利词库专利权人专利榜在售专利公布日期热门专利

【权利要求书】：

1.一种基于深度强化学习的分级存储数据自适应迁移方法，其特征在于，步骤如下：

步骤1：结合分级存储系统的特点，定义DQN的状态空间，具体如下：

步骤1.1：根据分级存储系统的文件块大小B、SSD存储空间大小S_S、HDD存储空间大小S_H，计算整个系统可存储文件块的总个数为

步骤1.2：对于文件块，有的是在SSD中的文件块，有的是在HDD中的文件块，有的是存储了数据的文件块，有的是还没有被利用的文件块；用一个二进制数代表该文件块的存储状态标识，如果是在SSD中并且存储了数据的文件块，该二进制数为1，否则为0；

步骤1.3：根据步骤1.2的标识结果，获得一个代表整个存储系统文件块存储状态的d维状态向量v，其中元素或者是1或者是0；那么状态空间即为状态向量v的多种可能结果，状态空间大小为2^d；

步骤2：结合分级存储系统的特点，定义DQN的动作空间；一个动作表示为二元组(a1,a2)，a1代表将状态向量v中的第a1个元素取反，即0变为1，1变为0；同理a2代表将状态向量v中的第a2个元素取反；如果a1＝a2，则状态向量保持不变；模拟了数据迁移的过程，即将第a1和a2个文件块交换下存储位置；

步骤3：结合分级存储系统的特点，定义执行动作后DQN得到的奖励r；奖励r考虑SSD命中率，它等于执行两个连续动作之间，用户从分级存储系统中读取数据文件块在SSD设备中的概率，即类似于高性能存储设备的命中率；

步骤4：初始化DQN参数，包括初始化神经网络的参数，Q函数进行随机初始化

步骤5：基于已有的数据访问历史日志数据，进行k次的仿真训练，具体做如下操作：

步骤5.1：定义起始状态向量v；随机选v中的个项位置赋值为1，即随机选择放置到SSD上的个文件块，其它项为0；

步骤5.2：基于定义的状态向量空间、动作空间、奖励执行DQN算法，执行k次仿真训练；具体做如下操作：

步骤5.2.1：根据日志数据的数据块访问情况，确定仿真过程的奖励值；即计算SSD数据块的命中率；

步骤5.2.2：根据奖励值更新DQN的神经网络参数，并得出需要执行的数据块迁移动作；以一定的概率ε随机选择动作，以1-ε的概率选择通过当前DQN网络预测得到最大Q值的动作，模拟数据块在SSD和HDD之间的迁移过程；

步骤5.2.3：重复步骤5.2.1和步骤5.2.2，共重复k次，得到DQN的网络参数；

步骤6：将DQN仿真训练出来的网络模型部署到分级存储系统中，继续根据数据块的访问操作计算奖励值，并反馈更新DQN网络，实现动态的强化学习，实现数据块的自适应迁移。

下载完整专利技术内容需要扣除积分，VIP会员可以免费下载。

免登录下载普通用户下载升级VIP会员，免费下载

该专利技术资料仅供研究查看技术是否侵权等信息，商用须获得专利权人授权。该专利全部权利属于东北大学，未经东北大学许可，擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作，请联系【客服】

本文链接：http://www.vipzhuanli.com/pat/books/202010785961.3/1.html，转载请声明来源钻瓜专利网。

专利分类

专利文献下载