[发明专利]面向电镜数据存储系统的文件元数据获取方法与系统有效
申请号: | 201711082627.6 | 申请日: | 2017-11-07 |
公开(公告)号: | CN108052524B | 公开(公告)日: | 2020-05-22 |
发明(设计)人: | 阮华斌;杨涛;王亚坤 | 申请(专利权)人: | 清华大学 |
主分类号: | G06F16/51 | 分类号: | G06F16/51;G06F16/58 |
代理公司: | 北京德琦知识产权代理有限公司 11018 | 代理人: | 谢安昆;宋志强 |
地址: | 100084*** | 国省代码: | 北京;11 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 面向 数据 存储系统 文件 获取 方法 系统 | ||
1.一种面向电镜数据存储系统的文件元数据获取方法,其特征在于,
步骤A-1:扫描文件系统所存储的数据文件目录,生成第一目录集合;
步骤A-2:将所述第一目录集合中的目录平均分配生成第一目录分组集合,所述第一目录分组集合包括M个目录分组;
步骤A-3:启动M个进程用于扫描所述M个目录分组中每个目录下的数据文件路径信息,一个进程对应一个目录分组;所有进程结束后,汇总所述M个进程的扫描结果,得到所述第一目录集合对应的第一全路径集合;
步骤A-4:将所述第一全路径集合中的路径平均分配生成第一路径分组集合,所述第一路径分组集合包括N个路径分组;
步骤A-5:启动N个进程用于获取所述N个路径分组中每个数据文件的元数据,一个进程对应一个路径分组;所有进程结束后,汇总所述N个进程的扫描结果,得到所述第一全路径集合对应的第一元数据集合。
2.根据权利要求1所述的方法,其特征在于,所述元数据至少包含数据文件的最近修改时间信息、最近访问时间信息、最近更改时间信息、数据文件全路径信息、数据文件所属用户、数据文件所属用户组、和/或数据文件大小。
3.根据权利要求2所述的方法,其特征在于,所述方法还包括:
步骤A-6:对所述第一元数据集合中的元数据信息进行统计分析,得到每个用户占用的存储空间或存储空间占比、每个用户组占用的存储空间或存储空间占比、总存储空间的使用占比、和/或每个文件夹占用的存储空间或存储空间占比。
4.根据权利要求1所述的方法,其特征在于,所述M、N取值与文件系统剩余IOPS和进程平均IOPS相关。
5.根据权利要求1所述的方法,其特征在于,所述步骤A-1中,所述扫描文件系统所存储的数据文件目录,包括:扫描文件系统中指定目录深度的数据文件目录;
所述步骤A-3和步骤A-4之间还包括:
步骤B-4:启动单进程扫描文件系统中所有指定目录深度之外的数据文件路径信息,生成第二全路径集合;
步骤B-5:将所述第二全路径集合并入所述第一全路径集合。
6.一种面向电镜数据存储系统的文件元数据获取系统,其特征在于,
目录扫描模块:扫描文件系统所存储的数据文件目录,生成第一目录集合;
目录分组模块:将所述第一目录集合中的目录平均分配生成第一目录分组集合,所述第一目录分组集合包括M个目录分组;
路径扫描模块:启动M个进程用于扫描所述M个目录分组中每个目录下的数据文件路径信息,一个进程对应一个目录分组;所有进程结束后,汇总所述M个进程的扫描结果,得到所述第一目录集合对应的第一全路径集合;
路径分组模块:将所述第一全路径集合中的路径平均分配生成第一路径分组集合,所述第一路径分组集合包括N个路径分组;
元数据扫描模块:启动N个进程用于获取所述N个路径分组中每个数据文件的元数据,一个进程对应一个路径分组;所有进程结束后,汇总所述N个进程的扫描结果,得到所述第一全路径集合对应的第一元数据集合。
7.根据权利要求6所述的系统,其特征在于,所述元数据至少包含数据文件的最近修改时间信息、最近访问时间信息、最近更改时间信息、数据文件全路径信息、数据文件所属用户、数据文件所属用户组、和/或数据文件大小。
8.根据权利要求7所述的系统,其特征在于,所述系统还包括:
统计分析模块:对所述第一元数据集合中的元数据进行统计分析,得到每个用户占用的存储空间或存储空间占比、每个用户组占用的存储空间或存储空间占比、总存储空间的使用占比、和/或每个文件夹占用的存储空间或存储空间占比。
9.根据权利要求6所述的系统,其特征在于,所述M、N取值与文件系统剩余IOPS和进程平均IOPS相关。
10.根据权利要求6所述的系统,其特征在于,所述目录扫描模块中,所述扫描文件系统所存储的数据文件目录,包括:扫描文件系统中指定目录深度的数据文件目录;
所述路径扫描模块和路径分组模块之间还包括:
次要路径扫描模块:启动单进程扫描文件系统中所有指定目录深度之外的数据文件路径信息,生成第二全路径集合;
路径汇总模块:将所述第二全路径集合并入所述第一全路径集合。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于清华大学,未经清华大学许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/201711082627.6/1.html,转载请声明来源钻瓜专利网。
- 数据显示系统、数据中继设备、数据中继方法、数据系统、接收设备和数据读取方法
- 数据记录方法、数据记录装置、数据记录媒体、数据重播方法和数据重播装置
- 数据发送方法、数据发送系统、数据发送装置以及数据结构
- 数据显示系统、数据中继设备、数据中继方法及数据系统
- 数据嵌入装置、数据嵌入方法、数据提取装置及数据提取方法
- 数据管理装置、数据编辑装置、数据阅览装置、数据管理方法、数据编辑方法以及数据阅览方法
- 数据发送和数据接收设备、数据发送和数据接收方法
- 数据发送装置、数据接收装置、数据收发系统、数据发送方法、数据接收方法和数据收发方法
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置
- 数据发送方法、数据再现方法、数据发送装置及数据再现装置