[发明专利]基于副本复制算法的数据查询方法无效
| 申请号: | 201110086027.3 | 申请日: | 2011-04-07 |
| 公开(公告)号: | CN102096723A | 公开(公告)日: | 2011-06-15 |
| 发明(设计)人: | 许海清;滕爱国;陈咏秋 | 申请(专利权)人: | 江苏省电力公司 |
| 主分类号: | G06F17/30 | 分类号: | G06F17/30 |
| 代理公司: | 南京汇盛专利商标事务所(普通合伙) 32238 | 代理人: | 陈扬 |
| 地址: | 210024 *** | 国省代码: | 江苏;32 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本发明公开了一种基于副本复制算法的数据查询方法,该方法综合考虑副本价值和复制代价因素,首先计算出节点上所有文件的流行度,基于流行度确定副本价值,然后计算副本复制的代价;对于每个网络链接,取其流量平均值,采用MMSE方法预测带宽;最后选择带宽最大的链接复制以获取副本,尽可能降低副本复制代价,实现副本复制。本发明提高了平均作业时间,减少了网络带宽资源的消耗,在分布式存储领域具有重要意义。 | ||
| 搜索关键词: | 基于 副本 复制 算法 数据 查询 方法 | ||
【主权项】:
1.一种基于副本复制算法的数据查询方法,其特征在于该方法综合考虑副本价值和复制代价因素,首先计算出节点上所有文件的流行度,基于流行度确定副本价值,然后计算副本复制的代价;对于每个网络链接,取其流量平均值,采用MMSE方法预测带宽;最后选择带宽最大的链接复制以获取副本;具体步骤如下:1)基于副本流行度确定副本价值副本价值用副本流行度表示,副本流行度越大,副本价值越大;副本流行度是指副本在一段时间内总的访问次数,通过统计文件访问记录获得;流行度计算方法如下:设每个文件初始流行度为0,该文件每被访问一次,则流行度加1;文件资源
在节点
上的被访问次数为
,称
为文件资源
在节点
上的单点流行度;若节点
上无资源
,则
= 0;初始流行度为0;设
为超节点
所辖域内文件资源
的总被访问频数,称
为
在
域内的域内流行度;
(1)为资源
在
各叶节点处单点流行度的总和,即对应域内流行度矩阵的第
列元素之和;副本价值的计算方法:流行度定期执行衰减过程,设
和
分别表示衰减前后的文件流行度,则文件流行度利用公式
(2)进行更新操作,其中
(3)称为衰减函数,x表示上一次访问该副本的时间点与现在时间点之间的绝对值;将时间离散化初始时间点设为0,以后逐渐增加,λ∈(0,1)为衰减参数,通过改变λ的值调整衰减速率;设
为价值变化函数,它反映副本的动态变化性;价值变化函数
使原先价值低的副本在经历一段时间后价值有所提高,从而获得更大的被保留的机会, 同时也使那些价值高的副本由于长时间没有被使用而丧失其积累的价值;被保留副本的价值变化情况为:
(4)设副本价值为
,则
(5)其中
为m 个数据副本的集合,
为上述数据副本的价值集合,
为价值收入函数,文件被引用则
值增加,
为价值支出函数,文件未被引用则
值减小;2)计算复制代价首先定义副本复制的代价为文件大小和传输带宽的比值;对于每个网络链接, 测量每个时间间隔D内的总流量,测量N次,分别记为f(1),…,f(N),取平均值fm(1),…fm(n)
(6)然后预测带宽,设未来 m个时间间隔内的真实网络带宽用Fm(n+1)表示,预测值用fm(n+1)表示, fm(n+1) 可由如下公式计算
(7)其中
和
是参数,且使得计算出的真实网络带宽与预测网络带宽的误差均方和
最小,在网络带宽预测值fm(n+1)大于真实值Fm(n+1)时,该链接将被复制获取副本,完成数据查询。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于江苏省电力公司,未经江苏省电力公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201110086027.3/,转载请声明来源钻瓜专利网。





