[发明专利]一种基于大数据的文件存储空间智能分配方法在审
申请号: | 201811083561.7 | 申请日: | 2018-09-17 |
公开(公告)号: | CN109189740A | 公开(公告)日: | 2019-01-11 |
发明(设计)人: | 不公告发明人 | 申请(专利权)人: | 深圳市心版图科技有限公司 |
主分类号: | G06F16/174 | 分类号: | G06F16/174;G06F16/172 |
代理公司: | 深圳市兰锋知识产权代理事务所(普通合伙) 44419 | 代理人: | 曹明兰 |
地址: | 518000 广东省深圳市罗湖区*** | 国省代码: | 广东;44 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | 本发明公开一种基于大数据的文件存储空间智能分配方法,包括以下步骤:将存储空间划分成若干包括若干存储子单元的存储单元,不同存储子单元均设置有若干关键字;获取空间占用请求,是否为压缩文件,若为,则解压;确定文件存储的存储单元,提取关键字;统计文件中各关键字出现的次数;统计文件与各存储子单元的关联度系数,并存储至关联度系数最大的存储子单元;检测关联度系数最大的存储子单元剩余存储空间,判断剩余存储空间是否小于剩余空间阈值,若小于,将是剩余空间最大的存储子单元中的剩余空间划分至该存储子单元。本发明提高了文件存储空间的合理性和整洁程度,能够实现存储空间的合理划分,具有分配合理性高以及存储效率高的特点。 | ||
搜索关键词: | 存储子单元 文件存储空间 剩余空间 关联度 剩余存储空间 存储单元 存储空间 统计文件 智能分配 大数据 合理性 存储 存储效率 空间占用 确定文件 压缩文件 解压 整洁 检测 分配 | ||
【主权项】:
1.一种基于大数据的文件存储空间智能分配方法,其特征在于:包括以下步骤:S1、对云服务器中的文件存储空间进行划分,划分成若干存储空间相同的存储单元,若干存储单元按照设定的顺序进行编号,分别为1,2,...,k,...,x,不同存储单元用于存储不同的文件类型,不同文件类型对应的存储单元均包括若干存储空间相等的存储子单元,同一存储单元中的若干存储子单元按照设定的顺序进行编号,分别为1,2....,j,...,m,不同存储子单元均设置有若干关键字,对不同存储单元中的各存储子单元中的关键字按照设定的顺序进行排序,依次为1,2,...,i,...,n,各存储单元中的各存储子单元中的所有关键字构成关键字集合Akj(akj1,akj2,...,akji,...,akjn),akji表示为第i个存储子单元中第j个存储子单元中第i个关键字;S2、获取文件存储发送的一空间占用请求,判断接收的需存储文件是否为压缩文件,若为压缩文件,并执行以下步骤S3,否则,执行步骤S4;S3、对压缩文件进行解压,对解压后的压缩文件中的各文件,依次执行步骤S4;S4、判断文件的类型,将文件的类型与各存储单元存储的文件类型进行对比,以确定文件存储的存储单元编号p,并提取该文件名称以及文件内容中的若有关键字,构成待检测关键字集合B(b1,b2,...,bf,...,bt),bf表示为待存储文件中第f个关键字,将存储该文件类型的存储单元中若干存储子单元对应的关键字集合A′pj分别与待检测关键字集合B中的若干关键字进行逐一对比,得到关键字对比集合A′pj(a′pj1,a′pj2,...,a′pji,...,a′pjn),a′pji表示该存储单元中第j个存储子单元中第i个关键字与待检测关键字集合中所有关键字的对比数值,若该存储单元中第j个存储子单元中第i个关键字与待检测关键字集合中的关键字相同,则取a′pji等于1,否则,a′pji等于0;S5、统计待存储文件中各关键字出现的次数,构成关键词次数集合C(c1,c2,...,cf,...,ct),cf表示为待存储文件中第f个关键字出现的次数,对关键字次数集合中各关键字出现的概率进行统计,得到关键字概率集合C′(c′1,c′2,...,c′f,...,c′t),c′f表示为第f个关键字在待检测文件中出现的概率,且
S6、提取关键字对比集合中对比数值为1的关键字出现的概率,并将提取的关键字出现的概率按照存储单元中各存储子单元中各关键字对应的顺序进行排序,构成关键字对比概率集合A″pj(a″pj1,a″pj2,...,a″pji,...,a″pjn),a″pji表示该存储单元中第j个存储子单元中第i个关键字在待存储文件中出现的概率,若该存储单元中第j个存储子单元中第i个关键字与待检测关键字集合中的关键字相同,则取a″pji等于c′f,f=1,2,...,t,否则,a″pji等于0;S7、统计待存储文件与存储该文件类型下的各存储子单元的关联度系数,筛选出关联度系数最大对应的存储子单元,并将待存储文件存储至该关联度系数最大的存储子单元内;S8、对待存储文件存入的存储子单元的剩余存储空间进行检测,判断该存储子单元剩余的存储空间是否小于设定的剩余空间阈值,若大于,则执行步骤S9,否则,对该存储单元中的各存储子单元的剩余存储空间进行检测,提取剩余存储空间最大的存储子单元,并将该存储子单元中的剩余存储空间以固定存储空间量划分至剩余存储空间小于剩余空间阈值的存储子单元内,直至剩余存储空间小于剩余空间阈值的存储子单元的剩余存储空间大于剩余空间阈值,其中,剩余存储空间最大的存储子单元中的剩余存储空间大于剩余空间阈值;S9、需存储文件存储完成,接收文件存储发送的下一空间占用请求,判断接收的需存储文件是否为压缩文件,若为压缩文件,进行解压并执行步骤S3‑S8,否则,执行步骤S3‑S8。
下载完整专利技术内容需要扣除积分,VIP会员可以免费下载。
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于深圳市心版图科技有限公司,未经深圳市心版图科技有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/patent/201811083561.7/,转载请声明来源钻瓜专利网。
- 上一篇:缓存空间回收方法和装置
- 下一篇:题目提取方法和系统