[发明专利]存储系统中基于溯源信息的文件元数据查询方法与系统有效
申请号: | 201410199580.1 | 申请日: | 2014-05-12 |
公开(公告)号: | CN103970871B | 公开(公告)日: | 2017-06-16 |
发明(设计)人: | 冯丹;刘进军;华宇;彭斌;聂振华;黄大彰;蔡娟 | 申请(专利权)人: | 华中科技大学 |
主分类号: | G06F17/30 | 分类号: | G06F17/30 |
代理公司: | 华中科技大学专利中心42201 | 代理人: | 梁鹏 |
地址: | 430074 湖北*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 存储系统 基于 溯源 信息 文件 数据 查询 方法 系统 | ||
1.一种存储系统中基于溯源信息的文件元数据查询方法,其特征在于,所述方法包括以下步骤:
(1)对安装在存储系统的客户端的溯源信息收集工具,设置溯源信息收集范围,获取初始溯源信息后经过处理分析得到文件相关性信息,然后将这些文件相关性信息发送到存储系统的元数据服务器;
(2)根据元数据服务器接收的文件相关性信息,生成关系图,所述关系图为无向有权图,所述关系图中的节点代表文件,边代表文件相关性;
(3)接收用户的查询请求,根据用户的查询条件在基于关联感知的元数据索引树中查询得到种子结果集;
(4)根据得到的种子结果集在关系图中进行查询,得到初始结果集,然后对初始结果集进行排序和精简得到最终结果集发送给查询用户;
如果步骤(4)中的所述查询为Top K查询,所述步骤(4)具体包括如下步骤:
(4-1-1)根据步骤(3)得到的种子结果集中的每个种子进行查询,获取与每个种子最靠近的K个结果,并计算各个结果与查询点之间的关系值,处理得到初始结果集;
(4-1-2)依据初始结果集中的各个结果与查询点的关系值的大小,对初始结果集进行排序,选取最好的K个结果作为最终结果集;
(4-1-3)将最终结果集返回给用户;
如果步骤(4)中的所述查询为近似最近邻查询,所述步骤(4)具体包括如下步骤:
(4-2-1)根据查询条件在基于关联感知的元数据索引树中进行查询操作,得到与查询请求最接近的那条数据,计算这条数据与查询请求之间的距离d,确定查询半径R为(1+ε)×d,ε为用户输入参数,用于确定查询半径;
(4-2-2)根据步骤(3)得到的种子结果集中的每个种子进行查询,查找离种子节点在这个查询半径R内的所有节点,并计算各个节点与查询点之间的关系值,处理得到初始结果集;
(4-2-3)依据初始结果集中的各个结果与查询点的关系值的大小,对初始结果集进行排序,得到最终结果集;
(4-2-4)将最终结果集返回给用户。
2.根据权利要求1所述的文件元数据查询方法,其特征在于,所述步骤(1)包括以下子步骤:
(1-1)在每一个存储系统的客户端程序中加入溯源信息收集模块;
(1-2)设置溯源信息收集模块收集溯源信息的范围,即只收集存储系统中涉及到文件相关性的信息;
(1-3)将在客户端收集的溯源信息经过去重,分析得到文件关系项后,将这些文件关系项发送到相应的元数据服务器,所述每个文件关系项中包含发生关系的两个文件的通用资源标识符URI和相关性信息。
3.根据权利要求2所述的文件元数据查询方法,其特征在于,所述步骤(2)包括以下子步骤:
(2-1)得到客户端传递过来的各条文件关系项;
(2-2)根据文件关系项中的两个文件的URI分别判断关系图中是否已包含代表这两个文件的节点,如果不包含,则在关系图中添加代表该文件的节点;
(2-3)根据文件关系项中两个文件的相关性信息,判断该文件关系项是否已在关系图中记录,如果已记录则更新这两个文件的相关性信息,否则在关系图中添加这一文件关系项。
4.根据权利要求1至3任一项所述的文件元数据查询方法,其特征在于,在所述步骤(3)之前还包括建立基于关联感知的元数据索引树的步骤,具体为:
选择文件属性中能反映文件相关性的属性,将每台元数据服务器上的元数据根据这些属性进行划分,然后建立索引,对所有的元数据服务器采用同样的方法建立一个树型的索引,从而在整个存储系统中建立基于关联感知的元数据索引树。
5.根据权利要求1到3任一项所述的文件元数据查询方法,其特征在于,所述步骤(3)包括以下子步骤:
(3-1)当元数据服务器集群中的某一台服务器接受到用户的查询请求后,通过查询条件与集群中各个元数据服务器的文件属性进行比较,确定需要查询的元数据服务器,并将查询请求转发给这台服务器;
(3-2)这台服务器接收到用户请求后,根据查询方式在元数据服务器内部对基于关联感知的元数据索引树进行查询操作,得到的结果作为种子结果集;
(3-3)计算各个种子节点与查询点之间的距离,并根据距离对种子结果集进行排序,其中种子结果集中种子结果的个数由查询条件确定。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于华中科技大学,未经华中科技大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201410199580.1/1.html,转载请声明来源钻瓜专利网。
- 信息记录介质、信息记录方法、信息记录设备、信息再现方法和信息再现设备
- 信息记录装置、信息记录方法、信息记录介质、信息复制装置和信息复制方法
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录装置、信息再现装置、信息记录方法、信息再现方法、信息记录程序、信息再现程序、以及信息记录介质
- 信息记录设备、信息重放设备、信息记录方法、信息重放方法、以及信息记录介质
- 信息存储介质、信息记录方法、信息重放方法、信息记录设备、以及信息重放设备
- 信息存储介质、信息记录方法、信息回放方法、信息记录设备和信息回放设备
- 信息记录介质、信息记录方法、信息记录装置、信息再现方法和信息再现装置
- 信息终端,信息终端的信息呈现方法和信息呈现程序
- 信息创建、信息发送方法及信息创建、信息发送装置