[发明专利]一种文件处理方法、装置及系统在审
| 申请号: | 201811092920.5 | 申请日: | 2018-09-18 |
| 公开(公告)号: | CN109324998A | 公开(公告)日: | 2019-02-12 |
| 发明(设计)人: | 陈莹昊;张大帅;李昂 | 申请(专利权)人: | 郑州云海信息技术有限公司 |
| 主分类号: | G06F16/13 | 分类号: | G06F16/13;G06F16/174;G06F21/62 |
| 代理公司: | 北京集佳知识产权代理有限公司 11227 | 代理人: | 王宝筠 |
| 地址: | 450018 河南省郑州市*** | 国省代码: | 河南;41 |
| 权利要求书: | 查看更多 | 说明书: | 查看更多 |
| 摘要: | 本申请提供了一种文件处理方法,该方法提出了一种新型的数据存储方式,该数据存储方式主要依赖于数据指纹库和文件信息库来实现数据存储,数据指纹库和文件信息库两者之间通过数据指纹进行关联,基于此,当需要存储某个文件时,将文件分割成低纬度的数据块,然后基于数据块来判断存储系统中是否已存储有相同数据,进而对于相同数据则不再重复存储,只需要再文件信息库中记录该文件与该数据块之间的相关关系即可,这样就能够极大地减小重复文件或者相似文件在存储系统中占用的空间,节约存储资源,提供存储空间利用率,以缓解大数据存储压力。另外,本申请还提供了对应的装置和设备。 | ||
| 搜索关键词: | 文件信息库 数据指纹 数据块 数据存储方式 存储系统 文件处理 存储 存储空间利用率 装置及系统 存储压力 存储资源 数据存储 文件分割 相似文件 重复存储 重复文件 大数据 低纬度 减小 申请 关联 占用 节约 缓解 记录 | ||
【主权项】:
1.一种文件处理方法,其特征在于,所述方法包括:获取待存储的文件;对所述文件进行数据分割得到有序的多个数据块;针对所述多个数据块中的每个数据块,利用哈希算法进行加密得到所述数据块对应的数据指纹;将所述数据块对应的数据指纹与数据指纹库中的数据指纹进行匹配,所述数据指纹库用于记录存储系统已存储的数据块对应的存储地址以及数据块对应的数据指纹的关联关系;若匹配成功,则将所述数据块对应的数据指纹、所述数据块对应的块顺序以及所述文件的唯一标识三者之间的关联关系记录在文件信息库中,所述块顺序用于表征所述数据块在所述文件中的位置顺序。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于郑州云海信息技术有限公司,未经郑州云海信息技术有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811092920.5/,转载请声明来源钻瓜专利网。





