[发明专利]一种文件处理方法、电子设备及存储介质在审
申请号: | 202111056882.X | 申请日: | 2021-09-09 |
公开(公告)号: | CN113868441A | 公开(公告)日: | 2021-12-31 |
发明(设计)人: | 吴良顺 | 申请(专利权)人: | 卓尔智联(武汉)研究院有限公司 |
主分类号: | G06F16/43 | 分类号: | G06F16/43;G06F16/41;G06F16/483;G06F21/60 |
代理公司: | 北京派特恩知识产权代理有限公司 11270 | 代理人: | 朱磊;张颖玲 |
地址: | 432200 湖北省武汉市黄陂区盘龙城经*** | 国省代码: | 湖北;42 |
权利要求书: | 查看更多 | 说明书: | 查看更多 |
摘要: | |||
搜索关键词: | 一种 文件 处理 方法 电子设备 存储 介质 | ||
本申请实施例公开了一种文件处理方法、电子设备及存储介质,其中,所述文件处理方法包括:根据文件在文件集合中的位置,确定文件的第一标识向量;根据散列函数和文件的特征向量,生成用于存储第一标识向量的第一存储位置;根据散列函数对应的散列表以及第一标识向量,确定第二标识向量;将第二标识向量存入对第一存储位置进行伪随机置换得到的第二存储位置;第二存储位置用于在搜索文件时,根据待搜索文件的第一标识向量指示用于查找待搜索文件的特征向量对应的第一存储位置。如此,根据第二存储位置,基于待搜索文件在文件集合中的位置即可查找到对应的文件,无需用户提供精准的关键词用于搜索,从而提高文件搜索效率。
技术领域
本发明涉及数据处理领域,尤其涉及一种文件处理方法、电子设备及存储介质。
背景技术
近年来,随着云计算的发展和普及,一些云服务产品开始在云端服务器为用户保存数据文件和搭建系统,越来越多的数据拥有者选择将他们的海量数据,尤其是包括音视频在内的多媒体文件存储到云端。为了保护个人隐私及敏感数据(如个人资料档案、医疗保健记录、家庭生活录像等),用户在上传文件时需要在本地先进行加密操作。
现有技术中,用户需要搜索相关数据文件时,一种方法是将所有密文下载到本地进行解密,在解密得到的明文上搜索,但这会带来巨大的网络开销和存储开销以及加解密操作带来的计算开销。另一种就是可搜索对称加密(Searchable Symmetric Encryption,SSE),用户建立明文索引并加密上传到远端服务器,在用户搜索某个关键词时,可以生成该关键词的搜索陷门(Trapdoor)并提交到服务器。服务器收到搜索陷门后对加密的索引进行搜索,并将对应的密文结果返回给用户。最后,用户对返回的密文进行解密。但是现有的SSE方案必须要基于关键词进行精准索引查询,导致文件搜索效率低下。
发明内容
有鉴于此,本发明实施例提供一种文件处理方法、电子设备及存储介质。
本发明的技术方案是这样实现的:
第一方面,本发明实施例提供一种文件处理方法,包括:
根据文件在文件集合中的位置,确定所述文件的第一标识向量;
根据散列函数和所述文件的特征向量,生成用于存储所述第一标识向量的第一存储位置;
根据所述散列函数对应的散列表以及所述第一标识向量,确定第二标识向量;
将所述第二标识向量存入对第一存储位置进行伪随机置换得到的第二存储位置;所述第二存储位置用于在搜索文件时,根据待搜索文件的第一标识向量指示用于查找所述待搜索文件的特征向量对应的第一存储位置。
进一步地,所述根据所述散列函数对应的散列表以及所述第一标识向量,确定第二标识向量,包括:
根据所述散列函数对应的散列表,确定所述第一存储位置的相邻存储位置;
基于所述相邻存储位置中存储的向量与所述第一标识向量形成并集,生成第二标识向量。
进一步地,所述方法还包括:
若所述相邻存储位置中未存储数据,则在所述相邻存储位置中写入长度与所述第一标识向量相同的全0向量。
进一步地,所述方法还包括:
将所述文件集合对应的标识信息和第二存储位置的信息拼接;
通过伪随机函数对拼接后的信息进行计算,并基于计算结果对所述第二存储位置进行加密。
进一步地,所述方法还包括:
若所述第一存储位置中已存储数据,则将所述第一标识向量与已存储的数据形成并集存入所述第一存储位置;
该专利技术资料仅供研究查看技术是否侵权等信息,商用须获得专利权人授权。该专利全部权利属于卓尔智联(武汉)研究院有限公司,未经卓尔智联(武汉)研究院有限公司许可,擅自商用是侵权行为。如果您想购买此专利、获得商业授权和技术合作,请联系【客服】
本文链接:http://www.vipzhuanli.com/pat/books/202111056882.X/2.html,转载请声明来源钻瓜专利网。