[发明专利]基于文件系统的海量小文件处理方法、系统及存储介质有效
申请号: | 202111616717.5 | 申请日: | 2021-12-28 |
公开(公告)号: | CN113986838B | 公开(公告)日: | 2022-03-11 |
发明(设计)人: | 黄传波;谢俊峰;彭涵钧;谢卓伟;钱禹航;涂磊 | 申请(专利权)人: | 成都云祺科技有限公司 |
主分类号: | G06F16/16 | 分类号: | G06F16/16;G06F16/13;G06F16/182 |
代理公司: | 暂无信息 | 代理人: | 暂无信息 |
地址: | 610041 四川省成*** | 国省代码: | 四川;51 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 基于 文件系统 海量 文件 处理 方法 系统 存储 介质 | ||
1.一种基于文件系统的海量小文件处理方法,其特征在于,所述方法包括步骤:
文件列表信息获取步骤,解析文件系统,获取指定目录的文件列表信息,其中,所述文件列表信息包括:指定目录及其子目录下全部目标文件的属性文件序号、父目录属性文件序号、数据大小和文件名;指定目录下全部子目录的属性文件序号、父目录属性文件序号和文件名;
第一判断步骤,根据所述文件列表信息,判断所述目标文件对应的属性文件是否读入内存;
第一读入步骤,如果否,将所述目标文件对应的属性文件及其相邻属性文件读入内存后执行文件数据定位步骤;如果是,则执行文件数据定位步骤;
文件数据定位步骤,解析内存中的所述目标文件对应的属性文件,定位目标文件的文件数据;
第二判断步骤,判断所述目标文件的文件数据是否读入内存;
第二读入步骤,如果否,将所述目标文件的文件数据及其相邻文件数据读入内存后执行文件数据写入步骤;如果是,则执行文件数据写入步骤;
文件数据写入步骤,将内存中的所述目标文件的文件数据写入指定文件,并获取所述目标文件的偏移记录;
重复步骤,重复第一判断步骤至文件数据写入步骤,直至遍历完全部目标文件的属性文件序号。
2.根据权利要求1所述的基于文件系统的海量小文件处理方法,其特征在于,所述文件列表信息获取步骤,包括:
打开指定目录所在的设备,获取指定目录的属性文件;
解析所述指定目录的属性文件,获取指定目录的目录项;
遍历并解析所述指定目录的目录项,获取指定目录的文件列表信息。
3.根据权利要求1所述的基于文件系统的海量小文件处理方法,其特征在于,所述文件系统包括:NTFS文件系统、XFS文件系统或EXT4文件系统。
4.根据权利要求1所述的基于文件系统的海量小文件处理方法,其特征在于,在所述文件列表信息获取步骤中,所述文件列表信息还包括:指定目录及其子目录下全部目标文件的创建时间或修改时间;
在所述第一判断步骤之前,还包括排序步骤:
根据所述创建时间或修改时间,对全部所述属性文件序号进行升序或降序排列。
5.根据权利要求1所述的基于文件系统的海量小文件处理方法,其特征在于,所述文件数据定位步骤,包括:
解析内存中的所述目标文件对应的属性文件,获取目标文件的文件数据索引;
根据所述目标文件的文件数据索引,获取目标文件的文件数据位置。
6.一种基于文件系统的海量小文件处理系统,其特征在于,所述系统,包括:
文件列表信息获取模块,用于解析文件系统,获取指定目录的文件列表信息,其中,所述文件列表信息包括:指定目录及其子目录下全部目标文件的属性文件序号、父目录属性文件序号、数据大小和文件名;指定目录下全部子目录的属性文件序号、父目录属性文件序号和文件名;
第一判断模块,用于根据所述文件列表信息,判断所述目标文件对应的属性文件是否读入内存;
第一读入模块,用于如果否,将所述目标文件对应的属性文件及其相邻属性文件读入内存后执行文件数据定位模块;如果是,则执行文件数据定位模块;
文件数据定位模块,用于解析内存中的所述目标文件对应的属性文件,定位目标文件的文件数据;
第二判断模块,用于判断所述目标文件的文件数据是否读入内存;
第二读入模块,用于如果否,将所述目标文件的文件数据及其相邻文件数据读入内存后执行文件数据写入模块;如果是,则执行文件数据写入模块;
文件数据写入模块,用于将内存中的所述目标文件的文件数据写入指定文件,并获取所述目标文件的偏移记录;
重复模块,用于重复第一判断模块至文件数据写入模块,直至遍历完全部目标文件的属性文件序号。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于成都云祺科技有限公司,未经成都云祺科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111616717.5/1.html,转载请声明来源钻瓜专利网。