[发明专利]一种分级存储系统中数据自动迁移优化方法有效
申请号: | 201510013498.X | 申请日: | 2015-01-12 |
公开(公告)号: | CN104573020B | 公开(公告)日: | 2017-11-10 |
发明(设计)人: | 于涛;张立强 | 申请(专利权)人: | 浪潮电子信息产业股份有限公司 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 济南信达专利事务所有限公司37100 | 代理人: | 姜明 |
地址: | 250101 山东*** | 国省代码: | 山东;37 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 分级 存储系统 数据 自动 迁移 优化 方法 | ||
技术领域
本发明涉及计算机应用技术领域,特别涉及一种分级存储系统中数据自动迁移优化方法。
背景技术
随着存储数据量的快速增长以及人们对于数据价值的深刻认知,存储系统的高并行性、高可靠性和高性价比变得越来越重要。传统的数据存储方式已经不能满足海量存储及其性能的需要,数据访问频率高的存储设备的性能成为访问的瓶颈。人们基于不同存储设备的物理特性,考虑将性能、可靠性和价格不同的存储设备结合在一起构造分级存储系统,用多级存储介质来存放访问频率不同的数据。将高性能、高成本的存储设备空间分配给高频率访问的数据,不经常访问的数据存放到低性能、低成本的存储设备中。进而释放高性能、高成本的存储空间,使得存储系统的成本接近于价格低的设备,而存储系统的整体性能倾向于性能高的设备。
分级存储系统的目的是通过将数据在不同性能设备间动态迁移以达到系统的高性能。目前,主要的数据迁移策略有基于存储空间的高低水位法,即基于高性能存储空间的使用情况进行数据迁移。该算法要求数据量超过存储空间的一定水位阈值时,启动数据迁移程序,直到数据量低于该水位线,或者没有需要迁移的数据时,停止数据迁移;位于低性能存储设备中的数据只有一定的访问热度时才会回迁到高性能存储设备中。
高性能存储空间有两个水位阈值:刷新水位阈值和删除水位阈值。当高性能存储的空间占用率达到刷新水位阈值时,系统启动数据刷新程序,将高性能存储空间中的脏数据拷贝一份到低性能存储设备中,但是仍保留高性能存储设备中的源数据,并将该源数据标识为干净数据。删除水位阈值则是指将高性能存储设备中的干净数据(已拷贝一份到低性能存储设备中的源数据)删除,以腾出足够的空间供新数据的写入。通常情况下,删除水位阈值应该大于刷新水位阈值。因为当数据刷新为干净数据之后才能从高性能存储设备中删除。
分级存储中的数据会根据数据迁移策略在不同的存储层级间进行迁移。但是采用该方法时,一旦高性能存储设备中的数据量达到指定的阈值(空间占用率)而触发数据迁移时,势必会增加系统的CPU、内存和磁盘IO的开销,以致影响整个存储系统的应用性能。针对这一情况,亟需开发一种基于存储设备负载的分级系统中数据迁移优化方法。
发明内容
本发明为了弥补现有技术的缺陷,提供了一种能够提升系统使用性能的分级存储系统中数据自动迁移优化方法。
本发明是通过如下技术方案实现的:
一种分级存储系统中数据自动迁移优化方法,其特征在于:包括存储设备负载判断和数据刷新两部分;
存储设备负载判断:获取存储设备的平均负载,判断各个存储设备的平均负载是否超过负载阈值,并以此为依据判断各个存储设备中的数据是否应该被列入到刷新列表;
数据刷新机制:将高性能存储空间中的脏数据拷贝一份到低性能存储设备中,但是仍保留高性能存储设备中的源数据,并且将该源数据标识为干净数据。
所述存储设备中设置有定时器,用于周期性地执行存储设备负载检查,并不断地进行存储设备负载判断;当获取的平均负载大于等于负载阈值时,如果高性能存储空间占用率还未达到水位阈值,系统将自动禁止数据迁移,并重新获取存储设备的平均负载,以保证存储系统的整体性能为高性能存储设备的性能;当平均负载小于负载阈值时,系统自动启动数据刷新操作,将数据迁移过程中需要支付的资源消耗在系统低负载时完成。
所述负载阈值为0.5。
所述系统在进行数据迁移操作前,首先要通过调用random()方法来随机选择刷新列表中的存储设备,其他存储设备重新获取平均负载,避免所有的存储设备同时执行数据刷新操作,对系统造成过大压力;存储设备中的数据首先使用哈希算法被分配到多个放置组中,然后对放置组再使用一致性哈希算法分布到存储节点。
所述放置组中的数据是有序的,对存储设备进行数据刷新时,将该存储设备上的所有放置组放入刷新队列中,刷新程序遍历处理所有放置组,并且对每个放置组中的数据仅处理其中部分数据;处理过的放置组重新放入刷新列队,直至放置组中不存在脏数据。
本发明的有益效果是:该分级存储系统中数据自动迁移优化方法,可以根据分级存储系统的负载情况,在低负载时,自动地周期性对空间占用率还未达到刷新水位阈值的高性能存储设备中的数据进行迁移,提前将高性能存储设备中的数据拷贝到低性能存储设备中,从而实现数据迁移效率的优化,使得系统维持在一个较为平稳的负载水平,提升整个集群存储系统的应用性能。
附图说明
附图1为发明数据自动迁移流程示意图。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于浪潮电子信息产业股份有限公司,未经浪潮电子信息产业股份有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201510013498.X/2.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置