[发明专利]基于副本复制算法的数据查询方法无效
| 申请号: | 201110086027.3 | 申请日: | 2011-04-07 |
| 公开(公告)号: | CN102096723A | 公开(公告)日: | 2011-06-15 |
| 发明(设计)人: | 许海清;滕爱国;陈咏秋 | 申请(专利权)人: | 江苏省电力公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬 |
| 地址: | 210024 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | |||
| 搜索关键词: | 基于 副本 复制 算法 数据 查询 方法 | ||
1.一种基于副本复制算法的数据查询方法,其特征在于该方法综合考虑副本价值和复制代价因素,首先计算出节点上所有文件的流行度,基于流行度确定副本价值,然后计算副本复制的代价;对于每个网络链接,取其流量平均值,采用MMSE方法预测带宽;最后选择带宽最大的链接复制以获取副本;具体步骤如下:
1)基于副本流行度确定副本价值
副本价值用副本流行度表示,副本流行度越大,副本价值越大;副本流行度是指副本在一段时间内总的访问次数,通过统计文件访问记录获得;
流行度计算方法如下:
设每个文件初始流行度为0,该文件每被访问一次,则流行度加1;文件资源 在节点上的被访问次数为,称为文件资源在节点上的单点流行度;若节点上无资源,则= 0;初始流行度为0;
设为超节点所辖域内文件资源的总被访问频数,称为在域内的域内流行度;
(1)
为资源在各叶节点处单点流行度的总和,即对应域内流行度矩阵的第列元素之和;
副本价值的计算方法:
流行度定期执行衰减过程,设和分别表示衰减前后的文件流行度,则文件流行度利用公式
(2)
进行更新操作,其中
(3)
称为衰减函数,x表示上一次访问该副本的时间点与现在时间点之间的绝对值;将时间离散化初始时间点设为0,以后逐渐增加,λ∈(0,1)为衰减参数,通过改变λ的值调整衰减速率;
设为价值变化函数,它反映副本的动态变化性;价值变化函数使原先价值低的副本在经历一段时间后价值有所提高,从而获得更大的被保留的机会, 同时也使那些价值高的副本由于长时间没有被使用而丧失其积累的价值;被保留副本的价值变化情况为:
(4)
设副本价值为,则
(5)
其中为m 个数据副本的集合,为上述数据副本的价值集合,为价值收入函数,文件被引用则值增加,为价值支出函数,文件未被引用则值减小;
2)计算复制代价
首先定义副本复制的代价为文件大小和传输带宽的比值;
对于每个网络链接, 测量每个时间间隔D内的总流量,测量N次,分别记为f(1),…,f(N),取平均值fm(1),…fm(n)
(6)
然后预测带宽,设未来 m个时间间隔内的真实网络带宽用Fm(n+1)表示,预测值用fm(n+1)表示, fm(n+1) 可由如下公式计算
(7)
其中和是参数,且使得计算出的真实网络带宽与预测网络带宽的误差均方和最小,在网络带宽预测值fm(n+1)大于真实值Fm(n+1)时,该链接将被复制获取副本,完成数据查询。
2.根据权利要求1所述的基于副本复制算法的数据查询方法,其特征在于:在存储空间不够存储新的副本时,保留流行度大的文件,删除流行度低的文件。
3.根据权利要求1所述的基于副本复制算法的数据查询方法,其特征在于:副本价值是副本的使用率历史信息和副本动态变化特性的反映;副本价值取决于 副本的稳定性以及最近的使用次数;副本的价值高, 表示该副本的使用率高或者稳定性高; 则保留该副本的概率大,即该副本的使用的寿命长。
4.根据权利要求1所述的基于副本复制算法的数据查询方法,其特征在于:对于需要存储到本地的文件,选择带宽最大的网络链接以获取文件副本。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省电力公司,未经江苏省电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201110086027.3/1.html,转载请声明来源钻瓜专利网。





